Original size 1024x1536

Анализ популярности музыкальных треков на Spotify

PROTECT STATUS: not protected

1. Введение

В своем исследовании я анализирую датасет Spotify Global Music Dataset, размещённый на платформе Kaggle. Он содержит информацию о музыкальных треках, артистах и альбомах, собранную с помощью публичного API Spotify. Для анализа я использовала файл track_data_final.csv, охватывающий достаточно большой временной промежуток.

big
Original size 1220x471

Палитра цветов.

Мне было интересно поработать с данными Spotify, поскольку стриминговые сервисы сегодня напрямую формируют музыкальный рынок. Этот датасет позволяет посмотреть не только на популярность отдельных треков, но и на то, как формат релиза и структура индустрии связаны с успехом музыки.

Датасет включает информацию о названии трека, популярности, дате релиза альбома, типе альбома, жанрах артиста и других характеристиках. Наличие временной информации позволило проанализировать долгосрочные тренды. Для анализа данных я использовала несколько разных типов визуализаций. Линейный график применялся для анализа временной динамики популярности треков. Гистограмма позволила изучить распределение популярности и выявить эффект «длинного хвоста». Для сравнения категорий я использовала donut-диаграмму и lollipop-диаграмму, которые наглядно показывают различия между типами треков и форматами релизов.

1. Тренд популярности по годам

Анализ показал, что средняя популярность треков со временем изменялась неравномерно. На графике заметны периоды роста и спада, что может быть связано как с изменениями музыкального рынка, так и со структурой данных.

big
Original size 1184x484
Original size 951x362

код для графика «средняя популярность треков по годам»

2. Распределение популярности

Распределение популярности оказалось асимметричным. Большинство треков имеют относительно низкие значения популярности, в то время как небольшое число композиций формирует «длинный хвост» хитов.

Original size 984x484
Original size 732x250

код для графика «распределение популярности»

3. Жанровая структура

Анализ жанров показал, что в датасете доминируют несколько наиболее массовых жанров. При этом присутствует широкий спектр менее популярных жанров, что отражает разнообразие музыкальной сцены.

Original size 984x584
Original size 806x297

код для графика «топ 10 жанров»

4. Explicit и Clean треки

Сравнение Explicit и Clean треков показало, что большая часть композиций относится к категории Clean. Однако доля Explicit-контента остаётся заметной, что указывает на изменение норм и тематики в современной музыке.

Original size 660x684
Original size 773x472

код для графика «доля explicit и clean треков»

5. Форматы релизов

Сравнение форматов релизов показало, что треки, выпускаемые в формате синглов, в среднем имеют более высокую популярность по сравнению с альбомными треками и сборниками. Это может быть связано с особенностями продвижения и потребления музыки.

Original size 881x483
Original size 708x635

код для графика «средняя популярность по типу альбома»

Выводы

Проведённый анализ показал, что популярность музыкальных треков является сложным и многомерным показателем. На неё влияют временной контекст, формат релиза и структура музыкального рынка. Результаты зависят от состава датасета, однако позволяют выявить ключевые тенденции внутри выборки. В целом можно сделать вывод, что успех музыкального трека не определяется одним фактором. Популярность формируется на пересечении рыночных условий, особенностей релиза и предпочтений аудитории, что делает музыкальную индустрию сложной и динамичной системой.

Использованные генеративные модели

ChatGPT (OpenAI) для помощи в структурировании анализа и генерации логотипа

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more