
Цель исследования
Музыка — важная часть повседневной жизни, а благодаря стриминговым сервисам и большим данным мы можем количественно исследовать ее свойства. Однако большинство слушателей воспринимают песни как набор субъективных впечатлений.
Цель этого проекта — превратить музыку в данные: проанализировать, как числовые аудиофичи (энергичность, танцевальность, темп, громкость и др.) распределяются по жанрам и как они между собой связаны.
Описание признаков
genre — жанр трека (категориальная переменная) danceability — танцевальность (от 0 до 1) energy — «энергия» трека (0–1) loudness — громкость, dB (от –35 до — speechiness, acousticness, instrumentalness, liveness, valence — дополнительные характеристики (0–1) tempo — темп, BPM (от 60 до 180)
Инструменты: pandas, numpy — для формирования и обработки данных matplotlib, seaborn — для построения графиков
Код анализа данных

Импорт библиотек + создание датасета
График 1
Корреляционная матрица (heatmap)
Выявлены сильные связи: energy and loudness (энергичные треки чаще громкие); отрицательная взаимосвязь acousticness and loudness / energy — акустичные треки спокойнее
График 2
Barplot — средняя энергия по жанрам
Жанры EDM / Dance Pop/ House/ Rap — лидеры по энергичности. Классические и акустические стили — внизу.
График 3
Scatterplot Tempo vs Energy
Темп и энергия связаны не строго: высокий BPM не равно высокая энергия — виден разброс. Темп — не главный показатель силы трека.
График 4
Boxplot — танцевальность по жанрам
График 5
Pairplot (tempo, energy, valence)
Энергия и темп часто коррелируют, но valence (настроение) почти не зависят от других фич. Настроение трека — отдельный измеритель.
График 6
Гистограмма громкости (loudness)
Большинство треков имеют громкость между -30 и -5 dB. Жанры с высокой loudness — чаще поп/ электронные
Выводы
1. Аудиофичи действительно отражают различия между жанрами: существуют закономерности, по которым жанры можно классифицировать по «энергии», «танцевалности», «громкости».
2. Темп — не самый надежный показатель энергии или танцевальности.
3. Эмоциональная окраска (valence) почти независима от технических параметров — это отдельный аспект восприятия музыки.
4. Сгенерированный данные показывают, что даже упрощенный «виртуальный Spotify» может дать реалистичные и объяснимы распределения — хорошая база для ученых проектов.