
// введение
В качестве основы для проекта был выбран датасет Spotify’s Most Streamed Songs 2024 с платформы Kaggle, представленный в формате CSV. Датасет содержит информацию о самых популярных треках на платформе Spotify в 2024 году, включая:
Музыкальный стриминг — одна из ключевых областей креативных индустрий, напрямую влияющая на то, как формируется массовая культура и внимание аудитории. Данные Spotify в данном случае мне интересны не только как данные музыкальной платформы, но и как данные алгоритмической системы, которая усиливает одни треки, оставляет в тени другие и формирует тренды через метрики популярности.
Для анализа были использованы разные типы визуализаций, каждая из которых отвечает на отдельный вопрос:
// этапы работы
Работа с данными проводилась в среде Google Colab с использованием библиотеки Pandas. Процесс включал следующие этапы:
i. Проверка структуры данных и типов столбцов ii. Разделение столбца Songs & Artist на отдельные поля Artist и Song iii. Очистка данных от пропущенных значений в показателе Daily iv. Сортировка и агрегация данных для подготовки отдельных визуализаций
// стилизация


Цвета, подписи и параметры оформления задавались исключительно кодом, без постобработки в графических редакторах. Референсом здесь послужила редакционная инфографика музыкальных медиа и аналитические визуализации стриминговых платформ.
// топ-10 самых стримимых треков
топ-10 самых стримимых треков (всего) — столбчатая диаграмма
Таблица показывает абсолютных лидеров по общему количеству стримов, чтобы понять, кто вообще доминирует на стриминге.
// топ-10 треков по ежедневным стримам
топ-10 треков по ежедневным стримам — столбчатая диаграмма
Диаграмма показывает, что большинство треков имеют умеренную ежедневную популярность.
// наследие против актуального хайпа
наследие против актуального хайпа — scatter plot
Высокие общие стримы не всегда означают высокую текущую популярность.
// падение популярности по рангу
падение популярности по рангу
Резкий обрыв после топа здесь значит, что внимание распределено неравномерно.
// кумулятивная кривая популярности
кумулятивная кривая популярности
Небольшое количество треков формирует большую часть рынка стримов.
// распределение текущего внимания
распределение текущего внимания (Daily)
Несмотря на то что топ-10 составляет малую долю от общего числа треков, на них приходится значительная часть всех стримов, что указывает на концентрацию внимания вокруг небольшого числа хитов.
// описание применения генеративных моделей
В процессе работы использовались модели ChatGPT и Gemini 2.5 Flash для оптимизации технической части работы.
Они применялась для помощи в формулировке аналитических вопросов к данным, уточнения логики выбора типов графиков, оптимизации и исправления ошибок кода. Все решения по интерпретации данных, визуальному стилю и финальным выводам принимались автором проекта.
Для генерации обложки была использована модель Ideogram 0.3 Turbo x 4.