
Описание проекта
Для данного проекта с сайта Kaggle я взяла набор данных от Яндекс музыки «Yandex Music TOP 100 songs».
Яндекс Музыка — это стриминговый сервис, который позволяет слушать музыкальные композиции, их подборки, альбомы и получать персональные рекомендации. В выбранном мною файле собрана информация о топ 100 композиций этой платформы за 2023 год. По каждой композиции представлена её длительность, количество лайков, прослушиваний, место в чарте и другие интересные сведения.
Я слушаю музыку на постоянной основе именно через этот сервис, поэтому мне стало интересно проанализировать этот датасет.
Типы созданных графиков:
Гистограмма Столбчатая диаграмма Круговая диаграмма Точечная диаграмма
Этапы работы:
Выбор набора данных Анализ данных Визуализация
Оформление графиков:
В начале я простраивала графики без стилизации, после чего с помощью GPT-4, поменяла цвета прямо в коде. В оформлении своих графиков я использовала одну и ту же цветовую палитру, которая основана на фирменном цвете Яндекс музыки — желтом.
Обложка: Обложка проекта сгенерирована в нейросети Ideogram от Google. Промт: Create a minimalist and modern cover design featuring a subtle gradient of Yandex Music’s brand colors, with a bright yellow background that fades to a muted yellow. In the center, there’s a stylized audio waveform symbol. The overall design exudes professionalism and a contemporary aesthetic, making it eye-catching and visually appealing.
Итоговые графики
После вывода данных в файле через: df = pd.read_csv ('/content/yandex_tracks_top100.csv') df.head (10) Мне захотелось визуализировать топ треков этого чарта.


Более интересной задачей стал анализ самых популярных исполнителей этой площадки. Дополнительной сложностью было оформление имен исполнителей с дополнительными скобками [’ANNA ASTI’], которые пришлось чистить с помощью кода.
Результат получился очень интересным, рада и горда что на первом месте стоит Король и Шут, ребята до сих пор рулят!
Наиболее интересным анализом было выявление самых популярных жанров. Выходит что в России слушают лишь русский реп и поп, которые заняли 44% и 39% соответственно. Также 7% занимает панк. Наглядно и интересно.
Дальше мне захотелось узнать, есть ли какая-то корреляция между длительностью трека и его популярностью. Построив точечную диаграмму я увидела что особой зависимости у этих данных нет.
Анализ интересующих меня данных показался очень увлекательным. Я увидела некоторые тенденции прослушиваний треков русской аудиторией и её особенности.
Инструменты
Kaggle — поиск датасета Google Colab — написание кода Matplotlib — поиск референсов визуализаций Ideogram — генерация изображений GPT-4 — помощь со стилизацией графиков через код, создание промпта Figma— чистка графиков