Original size 944x1280

Визуализация данных spotify

PROTECT STATUS: not protected
The project is taking part in the competition

Выбор базы данных

В данном датасете представлены данные о музыкальных треках, доступных на спотифае, с акцентом на их популярность и характеристики релиза. Анализ направлен на изучение структуры музыкального контента, включая исполнителей, временные особенности выпусков. Особое внимание уделяется показателям популярности, таким как количество прослушиваний и присутствие треков в плейлистах и чартах Spotify. В рамках исследования анализируется распределение стримов и выявляются наиболее популярные артисты и треки. Проведённый анализ позволяет получить общее представление о тенденциях в современной музыкальной индустрии и факторах, связанных с успехом треков на стриминговых платформах.

Набор данных

big
Original size 1036x261

• import pandas as pd — подключаю pandas • pd.read_csv (…) — загружаю CSV-файл с данными Spotify • df — таблица с данными • df.head () — показывает первые 5 строк, чтобы проверить файл

big
Original size 1319x961

Подключаю matplotlib и numpy, задаю фирменные цвета Spotify и настраиваю глобальный стиль графиков: тёмный фон, серый текст и сетку, чтобы все графики автоматически выглядели в стиле Spotify.

Графики

1

Original size 1147x386

Здесь я привожу столбец streams к числовому виду, убираю ошибки и пустые значения, затем строю гистограмму, чтобы увидеть распределение количества стримов у треков на Spotify.

Original size 1470x905

График показывает, как распределено количество стримов у треков. Хорошо видно, что большинство песен имеет относительно небольшое число прослушиваний, а очень популярные треки встречаются редко. Распределение сильно скошено вправо, что означает наличие небольшого числа очень популярных песен с миллиардами стримов. Это типичная ситуация для музыкальных платформ, где успех концентрируется у ограниченного числа треков.

2

Original size 961x631

Группирую данные по артистам, считаю суммарные стримы, выбираю топ-10, а затем строю горизонтальную диаграмму, чтобы наглядно сравнить самых популярных артистов.

Original size 2159x723

На графике показаны артисты, которые в сумме набрали наибольшее количество стримов. Видно, что несколько исполнителей значительно выше остальных по общей популярности. Это говорит о высокой концентрации внимания слушателей вокруг них. Даже в топ-10 разрыв между лидерами и остальными остаётся заметным.

3

Original size 1136x490

Я перевожу данные в числовой формат, убираю пропуски и строю scatter-график, чтобы посмотреть связь между количеством плейлистов Spotify и числом стримов.

Original size 617x488

График показывает зависимость между количеством плейлистов Spotify, в которые попал трек, и числом его стримов. Наблюдается положительная связь: треки, которые присутствуют в большем количестве плейлистов, как правило, имеют больше прослушиваний. При этом разброс точек остаётся большим, что говорит о том, что плейлисты достаточно важны.

4

Original size 1396x860

Я привожу столбцы к числовому формату, считаю медианные стримы для разного числа артистов и строю линейный график, показывающий, как меняется популярность трека в зависимости от количества артистов.

Original size 1399x919

Этот график показывает, как меняется медианное количество стримов в зависимости от числа артистов в треке. У сольных треков большая медиана стримов, но при увеличении числа артистов популярность сначала снижается. При этом для некоторых коллабораций с большим числом исполнителей медианные значения снова растут. Выглядит так, будто коллоборации особо не влияют на популярность треков, и могут, как улучшить популярноость трека, так и понизить ее.

Вывод

Анализ показывает, что популярность музыки на Spotify распределена крайне неравномерно: большинство треков имеют среднее число стримов, а основное внимание сосредоточено на небольшом числе хитов. Попадание трека в плейлисты Spotify тесно связано с ростом количества прослушиваний, но не гарантирует успех. Популярность также сильно концентрируется вокруг ограниченного круга артистов. Коллаборации не всегда приводят к росту стримов и работают эффективно только в отдельных случаях. Сезонность релизов выражена слабо, и успешные треки могут выходить в любое время года. В целом успех трека формируется за счёт сочетания артиста, продвижения и вовлечённости аудитории, а не одного отдельного фактора.

Описание применения генеративной модели

Использовала Chat GPT 5.0 (https://chatgpt.com). Промт для создания обложки: сгенерируй вертикальное изображение, на котором изображен лого спотифай на интересном фоне

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more