
Введение
Данный проект посвящён сбору, обработке и визуализации данных, связанных с творчеством и влиянием легендарной рок-группы Metallica. Группа является одной из самых успешных и долгоживущих в истории музыки, её дискография, концертная активность, награды и культурное влияние представляют собой богатый материал для количественного и качественного анализа. В качестве источников данных используются открытые базы и специализированные сайты, такие как Spotify API и Kaggle.
Мне интересно провести анализ именно этих данных, потому что Metallica — это моя самая любимая группа с детства, музыка которой сопровождала меня на разных этапах жизни. Группа прошла путь от андеграундного трэш-метала до мировой иконы, меняла звучание, сталкивалась с кризисами и триумфами, и всё это оставило чёткий след в данных: в динамике прослушиваний, географии концертов, объёмах продаж и реакции публики. Мне хочется не просто слушать их треки, но и понять, как их успех и влияние можно измерить с помощью реальных данных, в данном случае чисел и графиков.
Моя цель:понять ключевые закономерности в творческой эволюции Metallica, проанализировать популярность альбомов и синглов в разные периоды, выявить факторы влияющие на те или иные параметры. Проект позволит не только удовлетворить личный интерес, но и показать, как методы анализа данных могут быть применены к культурным феноменам.
Виды графиков и обоснование выбора
В проекте я использовала 4 вида визуализаций (графиков):
Изучающие: 1. Группированная столбчатая диаграмма, которая показывает распределение аудио-характеристик по альбомам, то есть как менялись energy, valence, danceability от альбома к альбому. 2. Линейный график с точками, который определяет динамику популярности треков во времени (связь между датой выпуска трека и его текущей популярностью на Spotify).
Объясняющие: 2. Точечная диаграмма с регрессией, показывает влияние duration_ms на popularity. 3. Тепловая карта корреляций аудио-параметров, выявляет взаимосвязь между всеми аудио-характеристиками (energy, valence, danceability, loudness, speechiness и др.)
Этапы работы
Для загрузки и переработки данных я пользовалась блокнотом Google Colab и соответственно языком программирования — Python. Анализ и обработку данных я проводила с помощью Pandas, для визуализации использовала Matplotlib и Seaborn (для приведения к единому цветовому стилю).
Для стилизации и приведения проекта к единому стилю, я извлекла цветовую палитру на сайте Adobe Color из черно-красной версии обложки альбома «And Justiece for All», и воспользовалась seaborn (настройка палитры у графиков).
Графики
Первый график — это группированная столбчатая диаграмма, которая показывает распределение аудио-характеристик по альбомам, то есть как менялись energy, valence, danceability от альбома к альбому.
Второй график — это линейный график с точками, который определяет динамику популярности треков во времени (связь между датой выпуска трека и его текущей популярностью на Spotify).
Третий график — это точечная диаграмма с регрессией, показывает влияние duration_ms на popularity.
Четвертый график — это тепловая карта корреляций аудио-параметров, выявляет взаимосвязь между всеми аудио-характеристиками (energy, valence, danceability, loudness, speechiness и др.)
Заключение
Проведенный анализ данных помог мне понять ключевые закономерности в творческой эволюции Metallica, проанализировать популярность альбомов и синглов в разные периоды, выявить факторы влияющие на те или иные параметры.
Gemini — консультация по коду. Chat.Ghpt — генерация обложки.