
1. Введение
В своем исследовании я анализирую датасет Spotify Global Music Dataset, размещённый на платформе Kaggle. Он содержит информацию о музыкальных треках, артистах и альбомах, собранную с помощью публичного API Spotify. Для анализа я использовала файл track_data_final.csv, охватывающий достаточно большой временной промежуток.

Палитра цветов.
Мне было интересно поработать с данными Spotify, поскольку стриминговые сервисы сегодня напрямую формируют музыкальный рынок. Этот датасет позволяет посмотреть не только на популярность отдельных треков, но и на то, как формат релиза и структура индустрии связаны с успехом музыки.
Датасет включает информацию о названии трека, популярности, дате релиза альбома, типе альбома, жанрах артиста и других характеристиках. Наличие временной информации позволило проанализировать долгосрочные тренды. Для анализа данных я использовала несколько разных типов визуализаций. Линейный график применялся для анализа временной динамики популярности треков. Гистограмма позволила изучить распределение популярности и выявить эффект «длинного хвоста». Для сравнения категорий я использовала donut-диаграмму и lollipop-диаграмму, которые наглядно показывают различия между типами треков и форматами релизов.
1. Тренд популярности по годам
Анализ показал, что средняя популярность треков со временем изменялась неравномерно. На графике заметны периоды роста и спада, что может быть связано как с изменениями музыкального рынка, так и со структурой данных.

код для графика «средняя популярность треков по годам»
2. Распределение популярности
Распределение популярности оказалось асимметричным. Большинство треков имеют относительно низкие значения популярности, в то время как небольшое число композиций формирует «длинный хвост» хитов.
код для графика «распределение популярности»
3. Жанровая структура
Анализ жанров показал, что в датасете доминируют несколько наиболее массовых жанров. При этом присутствует широкий спектр менее популярных жанров, что отражает разнообразие музыкальной сцены.
код для графика «топ 10 жанров»
4. Explicit и Clean треки
Сравнение Explicit и Clean треков показало, что большая часть композиций относится к категории Clean. Однако доля Explicit-контента остаётся заметной, что указывает на изменение норм и тематики в современной музыке.
код для графика «доля explicit и clean треков»
5. Форматы релизов
Сравнение форматов релизов показало, что треки, выпускаемые в формате синглов, в среднем имеют более высокую популярность по сравнению с альбомными треками и сборниками. Это может быть связано с особенностями продвижения и потребления музыки.
код для графика «средняя популярность по типу альбома»
Выводы
Проведённый анализ показал, что популярность музыкальных треков является сложным и многомерным показателем. На неё влияют временной контекст, формат релиза и структура музыкального рынка. Результаты зависят от состава датасета, однако позволяют выявить ключевые тенденции внутри выборки. В целом можно сделать вывод, что успех музыкального трека не определяется одним фактором. Популярность формируется на пересечении рыночных условий, особенностей релиза и предпочтений аудитории, что делает музыкальную индустрию сложной и динамичной системой.
Использованные генеративные модели
ChatGPT (OpenAI) для помощи в структурировании анализа и генерации логотипа