
Вводная часть:
Я выбрала датасет по музыке в Spotify (информация о треках, артистах и альбомах) и нашла его на платформе Kaggle.
Мне было интересно проанализировать эти данные, потому что я люблю музыку и регулярно слушаю её в Spotify — поэтому хотелось посмотреть на привычную для меня сферу «с другой стороны», через цифры. В датасете есть понятные показатели, которые реально отражают то, как мы воспринимаем музыку на платформе: популярность трека, аудитория артиста (подписчики), длительность трека, тип релиза и дата выхода. Это даёт возможность ответить на простые, но интересные вопросы: какие треки чаще становятся популярными, как связана популярность с масштабом артиста, какие типы релизов преобладают, и как меняется выпуск музыки по времени.
Я решила использовать четыре разных типа графиков, чтобы посмотреть на данные под разными углами и сделать выводы более наглядными:
Столбчатая диаграмма (горизонтальная) — чтобы показать длительность топ-50 самых популярных треков 2025 года.
Точечная диаграмма — чтобы проверить, есть ли связь между популярностью трека и числом подписчиков артиста.
Круговая диаграмма — чтобы показать структуру релизов в 2025 году: какие типы релиза занимают большую долю.
Линейный график — чтобы отразить динамику по времени, а именно как меняется количество треков по месяцам в 2025 году.
Дизайн

В качестве источника вдохновения для оформления графиков я взяла визуальный стиль Spotify — потому что он напрямую связан с темой проекта и хорошо узнаётся. Я ориентировалась на тёмный интерфейс приложения и его фирменный зеленый цвет.
Палитра

Фон (figure): #191414 Фон графика (panel): #121212 Акцентный зелёный (столбцы/точки/линия): #1DB954 Текст: #FFFFFF Вторичный текст (подписи осей/тики): #B3B3B3 Сетка/разделители: #2A2A2A
Этапы работы:
Обработка данных
Далее при помощи ChatGPT 5.2 я составила код для оформления графиков и шрифта в моих оттенках.
Столбчатая диаграмма
На этом графике я выделила топ-50 треков за 2025 и их длительность, чтобы узнать есть ли «типичный» диапазон минут у лучших треков.
Исходя из графика можно сказать, что у популярных треков в 2025 чаще всего «форматная» длительность, это удобно для массового прослушивания и плейлистов. При этом сама по себе длительность не гарантирует высокую популярность, но видно, что топ чаще формируется вокруг привычного диапазона, длинные треки встречаются гораздо реже и обычно не доминируют в топе, поскольку мы видим, что больше 6 минут в этом топе длится лишь один трек.
Точечная диаграмма
На этом графике я хочу понять есть ли зависимость между популярностью артиста и его трека, а также поскольку значения подписчиков слишком сильно разнятся я решила прологорифмировать это значение, чтобы точки на графике не слипались.
На графике заметна общая тенденция: чем больше подписчиков у артиста, тем чаще встречаются треки с более высокой популярностью. При этом разброс большой: у артистов со средней аудиторией тоже могут быть очень популярные треки, а у крупных артистов встречаются треки с умеренной популярностью. Большая аудитория артиста может повышать шансы на высокую популярность, но это не единственный фактор. График показывает, что популярность — это результат нескольких причин (качество трека, вирусность, продвижение), поэтому зависимость не «жёсткая», а скорее вероятностная.
Круговая диаграмма
С помощью круговой диаграммы я хочу узнать какие типы релизов преобладают в 2025 году — синглы, альбомы, сборники.
Круговая диаграмма помогает быстро понять структуру релизов: какие форматы доминируют на платформе в течение года. Мы видим, что большая часть релизов — синглы по доле «single», которая составляет 57,8%, альбомы, в свою очередь тоже достаточно часто используются (42%) в отличие от сборников, которых в 2025 только 0,3%. Это полезно как для анализа рынка, так и для понимания того, какие способы выпуска музыки сейчас наиболее распространены.
Линейный график
Используя этот график я хочу отследить, как меняется активность релизов в течение 2025 г, есть ли месяца, когда треков выходит больше или наоборот меньше. Однако стоит учитывать, что в датасете еще нет данных по ноябрю и декабрю 2025, поэтому в них линейный график принимает нулевое значение.
На графике видно, что количество релизов по месяцам неодинаково: есть периоды с более высокой активностью, как например август и сентябрь, и месяцы, где выпуск треков заметно ниже (февраль, апрель). Такие колебания могут быть связаны с сезонностью, маркетинговыми периодами и стратегиями релиза у артистов и лейблов. Линейный график показывает динамику во времени и помогает увидеть сезонные изменения. В рамках проекта это дополняет остальные графики: мы смотрим не только на характеристики треков, но и на то, когда они выходят.
Описание применения генеративной модели
Был использован только ChatGPT 5.2 для помощи с подбором цветов для кода. промпт: составь гамму цветов в стиле спотифая и сделай шрифт, тоже похожий на спотифай, затем внедри это в мой код.
Ссылки на используемые материалы:
https://chatgpt.com/ — нейросеть https://www.kaggle.com/datasets/wardabilal/spotify-global-music-dataset-20092025 — информация