Original size 1140x1600

Анализ данных Яндекс Музыки

PROTECT STATUS: not protected

Описание проекта

Для данного проекта с сайта Kaggle я взяла набор данных от Яндекс музыки «Yandex Music TOP 100 songs».

Яндекс Музыка — это стриминговый сервис, который позволяет слушать музыкальные композиции, их подборки, альбомы и получать персональные рекомендации. В выбранном мною файле собрана информация о топ 100 композиций этой платформы за 2023 год. По каждой композиции представлена её длительность, количество лайков, прослушиваний, место в чарте и другие интересные сведения.

Я слушаю музыку на постоянной основе именно через этот сервис, поэтому мне стало интересно проанализировать этот датасет.

Типы созданных графиков:

Гистограмма Столбчатая диаграмма Круговая диаграмма Точечная диаграмма

Этапы работы:

Выбор набора данных Анализ данных Визуализация

Оформление графиков:

В начале я простраивала графики без стилизации, после чего с помощью GPT-4, поменяла цвета прямо в коде. В оформлении своих графиков я использовала одну и ту же цветовую палитру, которая основана на фирменном цвете Яндекс музыки — желтом.

Обложка: Обложка проекта сгенерирована в нейросети Ideogram от Google. Промт: Create a minimalist and modern cover design featuring a subtle gradient of Yandex Music’s brand colors, with a bright yellow background that fades to a muted yellow. In the center, there’s a stylized audio waveform symbol. The overall design exudes professionalism and a contemporary aesthetic, making it eye-catching and visually appealing.

Итоговые графики

После вывода данных в файле через: df = pd.read_csv ('/content/yandex_tracks_top100.csv') df.head (10) Мне захотелось визуализировать топ треков этого чарта.

big
Original size 1927x470
big
Original size 2480x1609

Более интересной задачей стал анализ самых популярных исполнителей этой площадки. Дополнительной сложностью было оформление имен исполнителей с дополнительными скобками [’ANNA ASTI’], которые пришлось чистить с помощью кода.

Результат получился очень интересным, рада и горда что на первом месте стоит Король и Шут, ребята до сих пор рулят!

Original size 1919x589
Original size 2480x1549

Наиболее интересным анализом было выявление самых популярных жанров. Выходит что в России слушают лишь русский реп и поп, которые заняли 44% и 39% соответственно. Также 7% занимает панк. Наглядно и интересно.

Original size 1917x492
Original size 2480x1549

Дальше мне захотелось узнать, есть ли какая-то корреляция между длительностью трека и его популярностью. Построив точечную диаграмму я увидела что особой зависимости у этих данных нет.

Original size 1925x673
Original size 2480x1549

Анализ интересующих меня данных показался очень увлекательным. Я увидела некоторые тенденции прослушиваний треков русской аудиторией и её особенности.

Инструменты

Kaggle — поиск датасета Google Colab — написание кода Matplotlib — поиск референсов визуализаций Ideogram — генерация изображений GPT-4 — помощь со стилизацией графиков через код, создание промпта Figma— чистка графиков

Анализ данных Яндекс Музыки
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more