Original size 1140x1600

Анализ мировых данных Spotify (2009–2025)

PROTECT STATUS: not protected
The project is taking part in the competition

Описание проекта

Для своего проекта я выбрала Spotify Global Music Dataset (2009–2025) — обширную коллекцию музыкальных данных, содержащую информацию о треках, артистах, альбомах и их характеристиках. Этот датасет был найден на платформе Kaggle и представляет собой агрегированные данные из Spotify API, охватывающие 16 лет музыкальной истории

Мой выбор обусловлен несколькими причинами. Во-первых, я испытываю глубокий интерес к музыке. Во-вторых, Spotify является одной из ведущих музыкальных платформ с аудиторией в сотни миллионов пользователей, что делает его данные особенно ценными для анализа музыкальных трендов. В-третьих, этот датасет обладает особой ценностью благодаря своей полноте — он включает не только базовую информацию о треках, но и количественные метрики популярности, которые редко бывают доступны в открытом доступе.

Эти данные и легли в основу большей части моего анализа. В своей работе я рассматриваю популярность различных аспектов индустрии, их взаимосвязь или визуализирую определенную часть данных для наглядности.

Датасет

Стилизация

Основой стилизации стала айдентика платформы Spotify. Я использовала фирменный шрифт и цвета, немного расширила палитру смежными оттенками для более разнообразной визуализации данных.

big
Original size 4400x933

Диаграмма рассеяния

Между количеством треков в альбоме и популярностью отдельных песен наблюдается очень слабая отрицательная корреляция (r = −0.047). Это говорит о том, что объём альбома практически не влияет на популярность конкретного трека у слушателей.

big
Original size 3236x1785
0

Цвет кода изменен через ray.so

Круговая диаграмма

Среди наиболее популярных треков (вошедших в топ-50) наиболее популярными релизами являются полноценные альбомы — они составляют более половины (57.4%) выборки. Это может быть связано с тем, что альбомы чаще усердно продвигают, а мучительное ожидание релиза создаёт больший ажиотаж, что в итоге влияет на высокий уровень прослушиваний.

Original size 2095x2141
0

Цвет кода изменен через ray.so

Ящик с усами

популярность треков сильно варьируется в зависимости от жанра. Такие направления, как pop и edm, показывают стабильно высокую медианную популярность, в то время как grunge и art pop демонстрируют широкий разброс значений. Помимо этого довольно широкий разброс у категории неопределенного жанра.

Original size 3708x2025
0

Цвет кода изменен через ray.so

Столбчатая диаграмма

Абсолютное большинство треков в выборке (75%) имеют маркировку Explicit. Это отражает общую тенденцию в современной музыке, где контент для взрослой аудитории стал преобладающим.

Original size 3017x2025
0

Цвет кода изменен через ray.so

Гистограмма

Самыми популярными артистами на платформе являются Taylor Swift, Drake и Bad Bunny. Все они имеют рейтинг популярности, близкий к максимальному (94-100 баллов), что говорит об их глобальном влиянии и огромной аудитории на Spotify.

Original size 3218x2162
0

Цвет кода изменен через ray.so

Выводы

Анализ данных Spotify выявил ключевые закономерности в современной музыкальной индустрии. Хотя количество треков в альбоме слабо влияет на популярность релиза, слушатели активнее взаимодействуют с материалом из полноценных альбомов, чем с синглами — вероятно, благодаря масштабному продвижению и ажиотажу вокруг продукта.

Популярность треков сильно варьируется в зависимости от жанра: pop и edm демонстрируют стабильно высокую медианную популярность, в то время как grunge и art pop показывают широкий разброс значений. Значительный разброс также наблюдается у релизов с неопределённым жанром, что может указывать на экспериментальный или межжанровый характер таких композиций.

При этом абсолютное большинство треков (75%) имеют маркировку Explicit, что подтверждает доминирование «взрослого» контента на платформе.

Таким образом, успех трека на Spotify формируется под влиянием нескольких факторов: статуса исполнителя, жанровой принадлежности и формата релиза. Альбомы остаются основным драйвером внимания аудитории, а контент с маркировкой Explicit стал новой нормой в современной музыке.

Описание применения генеративной модели

В своем проекта я использовала Deepseek (https://chat.deepseek.com) для улучшения и коррекции кода, а также для повышения качества и лучшей читабельности описаний.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more