
Введение в тему
Я выбрала для анализа датасет о популярности музыкальных треков на платформе Spotify и их аудио-характеристиках. В связи с тем, что музыка сопровождает меня каждый день, мне стало интересно понять, какие особенности делают трек по-настоящему популярным.
Для поиска датасета с характеристиками аудио, жанрами и уровнем популярности я использовала ресурс https://www.kaggle.com
Мне хотелось выяснить и ответить на главные вопросы, которые интересуют меня:
Тип диаграмм
В рамках исследования я использовала следующие типы диаграмм:
Гистограмма распределения: применялась для анализа того, как распределена популярность треков на Spotify. Позволяет выявить наиболее частые значения, посмотреть на выбросы и сравнить среднее с медианой.
Столбчатая диаграмма (barplot): использовалась для сравнения средней популярности жанров. Такой график помогает выявить жанры-лидеры и построить ТОП-10 по популярности.
Boxplot (ящиковая диаграмма): применялся для анализа распределений внутри самых распространённых жанров. Boxplot показывает медиану, интерквартильный размах и выбросы, позволяя понять, насколько однородны жанры внутри себя.
Точечная диаграмма (scatter plot): использовалась для изучения взаимосвязи между танцевальностью трека и его популярностью. Scatter plot помогает увидеть возможный тренд или отсутствие выраженной зависимости.
Линейный график (line plot): был применён для анализа того, как средняя популярность меняется в зависимости от уровня громкости трека. Линейный график показывает общую динамику между бинами громкости.
Тепловая карта корреляций (heatmap): позволяет визуализировать взаимосвязи между несколькими аудио-характеристиками одновременно. Heatmap помогает быстро определить признаки, которые имеют наиболее сильную положительную или отрицательную связь друг с другом.
Работая с такими данными, можно увидеть музыкальный рынок намного глубже — через поведение миллионов слушателей и через то, как они реагируют на разные характеристики треков.
В этом проекте я использовала палитру, основанную бирюзовом цвете: эти цвета напрямую ассоциируются со стилистикой Spotify и других музыкальных платформ.
Бирюзовый цвет делает графики визуально цельными и современными: мягкое для восприятия, но достаточно контрастно, чтобы выделить ключевые элементы.
Подобная палитра отражает атмосферу потоковых сервисов: где музыка подаётся через минималистичный, глубоко насыщенный интерфейс, и данные выглядят так же выразительно, как и сами треки.
В качестве основного шрифта для всех графиков я использовала DejaVu Sans — минималистичный, современный и хорошо читаемый шрифт. Он подходит для визуализаций, потому что остаётся разборчивым даже на небольших размерах и гармонично сочетается с цифровой стилистикой музыкальных платформ.


импорт файла и указание цветовой палитры
График № 1. Гистограмма популярности треков
Меня заинтересовало, как именно распределена популярность треков на Spotify: встречается ли много по-настоящему «хитовых» композиций или же большинство треков остаются в среднем диапазоне.
Особенно важно понять, есть ли явный перекос в сторону низкой популярности — то есть создаётся ли большое количество музыки, которая почти не получает внимания слушателей или распределение более равномерное.
график № 1
код для графика № 1
График № 2. Столбчатая диаграмма (barplot) жанров по средней популярности
Мне стало любопытно, какие музыкальные жанры в среднем оказываются популярнее других. Интересно увидеть, совпадает ли реальность с ожиданиями: действительно ли лидируют традиционно узнаваемые жанры, такие как поп или k-pop или в топ поднимаются менее очевидные категории.
график № 2
код для графика № 2
График № 3. Boxplot (ящиковая диаграмма). Распределение популярности внутри популярных жанров
Меня заинтересовало, насколько сильно различается популярность внутри отдельных жанров. Даже если жанр в целом входит в число распространённых, далеко не факт, что все треки внутри него одинаково успешны.
Особенно любопытно понять, есть ли жанры, где популярность распределена более равномерно, или наоборот встречаются резкие скачки: одни треки почти не слушают, а другие достигают высоких значений.
график № 3
код для графика № 3
График № 4. Scatterplot: Связь танцевальности и популярности трека
При анализе меня заинтересовал вопрос, действительно ли более танцевальные треки оказываются популярнее на Spotify. Танцевальность часто воспринимается как характеристика, напрямую связанная с привлекательностью музыки: чем ритмичнее и динамичнее композиция, тем проще ей попасть в плейлисты и завоевать широкую аудиторию.
Особенно важно понять, существует ли реальная зависимость или это только ожидание: повышает ли высокий показатель danceability вероятность того, что трек услышат и полюбят, или популярность распределяется хаотично и почти не зависит от ритмичности.
график № 4
код для графика № 4
График № 5. Линейный график (line plot): средняя популярность в зависимости от громкости трека
Меня также заинтересовало, влияет ли громкость трека на его популярность. Громкость часто ассоциируется с выразительностью и энергетикой музыки, поэтому любопытно понять, действительно ли более громкие композиции получают больше внимания слушателей или же эта характеристика практически не связана с конечной популярностью.
Разбиение значений громкости на интервалы позволяет увидеть общий тренд: есть ли диапазоны, в которых треки слушают чаще, и наблюдается ли снижение интереса к слишком тихим или, наоборот, чрезмерно громким композициям.
график № 5
код для графика № 5
График № 6. Heatmap: корреляционная матрица признаков
Меня также заинтересовало, как разные аудио-характеристики треков связаны между собой. Некоторые параметры, такие как громкость, энергия или танцевальность, по идее могут влиять друг на друга, формируя общее звучание композиции. Поэтому важно понять, существуют ли между ними заметные зависимости или же каждый признак работает сам по себе.
график № 6
код для графика № 6
Выводы
Анализ данных Spotify показал, что популярность треков формируется под влиянием сразу нескольких факторов, однако вклад каждого из них довольно неоднородный. Распределение популярности оказалось смещённым: действительно популярных треков относительно мало, тогда как большинство композиций остаются в среднем или низком диапазоне.
Жанровый разбор показал, что в ТОП по средней популярности часто входят не только ожидаемые категории вроде pop или k-pop, но и менее очевидные направления, что подчёркивает разнообразие предпочтений слушателей. При этом boxplot демонстрирует, что внутри каждого жанра существует значительная вариативность: один и тот же жанр может включать как очень успешные треки, так и почти незамеченные.
Связь между танцевальностью и популярностью оказалась слабой: несмотря на небольшую положительную тенденцию, танцевальность сама по себе не гарантирует высокие показатели. С громкостью ситуация схожая: наблюдаются определённые колебания, но явного линейного тренда нет, что говорит о более сложной природе восприятия звука.
Корреляционная матрица подтвердила, что сильных связей между характеристиками немного. Наиболее заметные взаимосвязи наблюдаются между громкостью и энергией: параметры, описывающие физическую интенсивность трека. Однако их влияние на популярность остаётся умеренным или слабым.
В целом можно сделать вывод, что популярность трека на Spotify формируется комплексом факторов, среди которых жанр и общая звуковая структура играют роль, но не являются определяющими сами по себе.
Музыкальные предпочтения слушателей разнообразны и успех композиции зависит не от одной характеристики, а от сочетания многих элементов: от стиля и настроения до подачи, контекста и индивидуального вкуса аудитории.
Описание применения генеративной модели
Для создания обложки я использовала нейросеть Ideogram v0.2 с промтом: «Minimalistic Spotify-style cover art in official Spotify color palette (black, deep green #1DB954, white). In the center a clean, sharp Spotify logo. The logo is wearing large over-ear headphones, slightly tilted for a dynamic modern look. Headphones are sleek, matte black with subtle green accents, matching Spotify branding. Background is deep black or dark charcoal for contrast. Soft shadows, smooth lighting, high-resolution vector style, crisp lines, modern digital aesthetic.» https://ideogram.ai/t/explore