Original size 1140x1600

Анализ данных Spotify 2015 — 2025

PROTECT STATUS: not protected
The project is taking part in the competition

В данном проекте проведен анализ данных Spotify за последнее десятилетие (2015–2025 гг.). С помощью этого удалось выявить тенденции в популярности жанрах, длительности песен, а также их «танцевальности».

Графики отсылают к эстетике эквалайзеров и звуковых волн, поскольку они схожи внешне и наиболее ярко передают процесс создания музыкальных композиций. В качестве основного цвета был выбран основной цвет из брендбука Spotify #1DB954

big
Original size 3000x700

В своём исследовании я использовала данные с сайта Kaggle (kaggle.com). В этом датасете собран обзор музыкальных трендов с 2015 по 2025 год. Он содержит 85 000 треков с подробными метаданными и аудиохарактеристиками, которые включают в себя названия треков, исполнителей, альбомы, жанры, даты выпуска, темп, громкость, энергетику, танцевальность, инструментальное звучание и другое.

В исследовании была использована лишь часть данных: жанры, длительность, даты выпуска, популярность и танцевальность.

Данные представлены в виде графиков и гистограмм, так как они наглядно показывают взаимосвязь данных, их динамику изменения в зависимости от разных показателей.

Для визуализации я выбрала несколько типов графиков:

Гистограмма, которая наиболее точно показывает взаимосвязь жанров и их популярности

Гистограмма, которая позволила проанализировать длительность песен по жанрам

Точечный график, который показал связь длительности и популярности песен

Линейный график, который позволил проанализировать танцевальность песен по годам и ее динамику

Использованные библиотеки

В коде использованы библиотека pandas для чтения и обработки CSV-файла, matplotlib.pyplot для создания структуры и отрисовки всех типов графиков — от гистограмм до точечных диаграмм. Для расширенных возможностей работы с цветом, особенно для создания плавных градиентов в визуализациях вроде эквалайзера и звуковой волны, применялась библиотека matplotlib.colors. Дополнительные графические элементы, такие как прямоугольники для столбцов эквалайзера и эллипсы для выделения кластеров данных на диаграмме рассеяния, добавлялись с помощью matplotlib.patches.

Original size 3508x2039

Обработка данных

Сгруппировать или отсортировать данные, если требуется

Original size 3508x793

Нормализация данных

Original size 3508x793

В некоторых случаях необходимо было провести фильтрацию по времени, чтобы сделать анализ тенденций последнего десятилетия.

Original size 3508x897

Преобразовать единицы измерения времени, если такой тип данных использовался в графике

Original size 3508x609

Создаём основу для графика

Original size 3508x480

Задаём ему параметры внешнего вида, создавая градиент от фиолетового до фирменного зеленого цвета Spotify.

Original size 3500x1713

Визуализация

0

Популярность музыкальных жанров. Гистограмма

С помощью данного графика мы узнали, что за последние 10 лет жанр хип хоп лидирует по прослушиваниям, а значит, и по популярности. Менее популярными являются рок, джаз и кантри.

0

Распределение длительности песен по жанрам. Гистограмма

Данная гистограмма показала статистику длительности песен и их количества на платформе за последние 10 лет. С помощью этих данных мы узнали, что песен короче 1,5 минут и длиннее 8 минут практически нет.

0

Связь длительности и популярности песен. Точечная диаграмма

Точечная диаграмма показывает взаимосвязь длительности песен и их популярности. Оказалось, что длительность песни несильно влияет на её популярность, хотя можно было предположить иначе.

0

Динамика танцевальности музыки. Линейный график

С помощью линейного графика можно наглядно увидеть, что 2015 и 2022 год стали пиковыми по танцевальности песен. Можно предположить, что это связано с событиями, происходящими в мире. 2019 год, наоборот, оказался «провальным», вероятно, из-за пандемии.

Вывод

Данные графики позволили установить порой непредсказуемые взаимосвязи, например, что длительность песни не влияет на ее популярность. Также с помощью этих данных можно увидеть как глобальные события в мире влияют на музыкальные предпочтения людей.

Описание применения генеративной модели

В проекте были использованы изображения, сгенерированные в Krea, в качестве референсов и иллюстративного ряда.

Промпты: spotify logo on the purple background spotify music waves equalizer

Ссылка: https://www.krea.ai/image

Список источников

[1] Выгрузка данных с Kaggle.com (URL: https://www.kaggle.com/datasets/rohiteng/spotify-music-analytics-dataset-20152025) Просмотрено: 14.12.2025

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more