
Вводная часть:
- Для проекта я выбрала базу данных по самым популярным песням в мире на Spotify на ресурсе kaggle — https://www.kaggle.com/datasets/arnavvvvv/spotify-music/discussion
- Мне было интересно проанализировать именно эти данные потому что я увлекаюсь музыкой
- Я использовала разные виды диаграмм для визуального разнообразия:
Этапы работы:
Я использовала данные из Kaggle по популярным песням Spotify, загрузила их с помощью pandas (pd.read_csv) с указанием кодировки encoding='windows-1251', чтобы избежать ошибок при чтении. Данные обработала в зависимости от диаграммы: в линейной диаграмме (прослушивания по годам) преобразовала streams в числовой формат (pd.to_numeric) и сгруппировала по released_year. В столбчатой диаграмме (количество треков по годам) посчитала value_counts (). В круговой диаграмме (режим мажор/минор) отобразила распределение mode. Для гистограммы BPM использовала plt.hist () и sns.kdeplot ()для визуализации KDE-плотности. В горизонтальной диаграмме (треки по месяцам) проверила наличие released_month, преобразовала в числа и заменила номера на названия.
Итоговые графики
Здесь можно найти все коды для пяти графиков в формате IPYNB в открытой папке на гугл диске -https://drive.google.com/drive/folders/1bTDcCKe8dXKir9N78v3gyZgoQPRmzaFz?usp=drive_link
Ниже к каждому графику прикреплена альтернативная ссылка на файл в google collab

График № 1. Линейная диаграмма: Суммарное количество прослушивания по годам
График № 1. Линейная диаграмма: Суммарное количество прослушивания по годам
Блокнот с кодом в google collab — https://colab.research.google.com/drive/1F6l5s4Wnzf0ZqhEv5qCkhixDnbeTLnXY?usp=sharing
Датасет- https://www.kaggle.com/datasets/arnavvvvv/spotify-music/discussion
График № 2. Столбчатая диаграмма: Количество треков по годам
График № 2. Столбчатая диаграмма: Количество треков по годам
Блокнот с кодом в google collab — https://colab.research.google.com/drive/1Mr4-lJPbeyHuWyFQA4uNCVN4WZE5Xpcc?usp=sharing
Датасет- https://www.kaggle.com/datasets/arnavvvvv/spotify-music/discussion
3. Круговая диаграмма: Распределение по режиму (мажорные/минорные)
График № 3. Круговая диаграмма: Распределение по режиму (мажорные/минорные)
Блокнот с кодом в google collab —https://colab.research.google.com/drive/1IKyEEjeujLjPfVfTgA1ws7eDbQX0s5FH?usp=sharing
Датасет- https://www.kaggle.com/datasets/arnavvvvv/spotify-music/discussion
4. Гистограмма: Распределение BPM (ударов в минуту)
График № 4. Гистограмма: Распределение BPM (ударов в минуту)
Блокнот с кодом в google collab — https://colab.research.google.com/drive/10YOdqbcQzuWcnxPOcAXiB7ZLgUhj8OLe?usp=sharing
Датасет- https://www.kaggle.com/datasets/arnavvvvv/spotify-music/discussion
5. Горизонтальная столбчатая диаграмма: Количество треков выпущенных по месяцам
График № 5. Горизонтальная столбчатая диаграмма: Количество треков выпущенных по месяцам
Блокнот с кодом в google collab — https://colab.research.google.com/drive/115nkC0QEDeHPfbbDjbzYwJWTxwPTiL0U?usp=sharing
Датасет- https://www.kaggle.com/datasets/arnavvvvv/spotify-music/discussion
Дополнительно (Описание применения генеративной модели)
Обложка для проекта была сгенерирована с помощью нейросети Recraft — https://www.recraft.ai/