Original size 832x1248

Структурный анализ самых проигрываемых песен Spotify за 2024 год

PROTECT STATUS: not protected
The project is taking part in the competition

// введение

В качестве основы для проекта был выбран датасет Spotify’s Most Streamed Songs 2024 с платформы Kaggle, представленный в формате CSV. Датасет содержит информацию о самых популярных треках на платформе Spotify в 2024 году, включая:

i. общее количество стримов ii. среднее количество ежедневных стримов iii. исполнителя и название трека Анализ этих данных позволяет посмотреть, насколько внимание слушателей распределено равномерно и чем отличается долгосрочная популярность от актуального хайпа.

Музыкальный стриминг — одна из ключевых областей креативных индустрий, напрямую влияющая на то, как формируется массовая культура и внимание аудитории. Данные Spotify в данном случае мне интересны не только как данные музыкальной платформы, но и как данные алгоритмической системы, которая усиливает одни треки, оставляет в тени другие и формирует тренды через метрики популярности.

Для анализа были использованы разные типы визуализаций, каждая из которых отвечает на отдельный вопрос:

// Столбчатые диаграммы — для сравнения топ-10 треков по общим и ежедневным стримам // Scatter plot — для анализа соотношения «наследие и актуальный хайп» // Кумулятивная кривая (Long Tail) — для изучения концентрации внимания // Rank plot — для визуализации резкости падения популярности // Круговая диаграмма (Donut) — для демонстрации распределения текущего внимания

// этапы работы

Работа с данными проводилась в среде Google Colab с использованием библиотеки Pandas. Процесс включал следующие этапы:

i. Проверка структуры данных и типов столбцов ii. Разделение столбца Songs & Artist на отдельные поля Artist и Song iii. Очистка данных от пропущенных значений в показателе Daily iv. Сортировка и агрегация данных для подготовки отдельных визуализаций

Original size 2048x1204

// стилизация

Original size 1814x777
Для визуализации был выбран единый минималистичный стиль: // чёрный фон // белые графические элементы // акцентный зелёный цвет #73B02B // жёлтые оттенки для круговой диаграммы

Цвета, подписи и параметры оформления задавались исключительно кодом, без постобработки в графических редакторах. Референсом здесь послужила редакционная инфографика музыкальных медиа и аналитические визуализации стриминговых платформ.

// топ-10 самых стримимых треков

0

топ-10 самых стримимых треков (всего) — столбчатая диаграмма

Таблица показывает абсолютных лидеров по общему количеству стримов, чтобы понять, кто вообще доминирует на стриминге.

// топ-10 треков по ежедневным стримам

0

топ-10 треков по ежедневным стримам — столбчатая диаграмма

Диаграмма показывает, что большинство треков имеют умеренную ежедневную популярность.

// наследие против актуального хайпа

0

наследие против актуального хайпа — scatter plot

Высокие общие стримы не всегда означают высокую текущую популярность.

// падение популярности по рангу

0

падение популярности по рангу

Резкий обрыв после топа здесь значит, что внимание распределено неравномерно.

// кумулятивная кривая популярности

0

кумулятивная кривая популярности

Небольшое количество треков формирует большую часть рынка стримов.

// распределение текущего внимания

0

распределение текущего внимания (Daily)

Несмотря на то что топ-10 составляет малую долю от общего числа треков, на них приходится значительная часть всех стримов, что указывает на концентрацию внимания вокруг небольшого числа хитов.

// описание применения генеративных моделей

В процессе работы использовались модели ChatGPT и Gemini 2.5 Flash для оптимизации технической части работы.

Они применялась для помощи в формулировке аналитических вопросов к данным, уточнения логики выбора типов графиков, оптимизации и исправления ошибок кода. Все решения по интерпретации данных, визуальному стилю и финальным выводам принимались автором проекта.

Для генерации обложки была использована модель Ideogram 0.3 Turbo x 4.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more