Original size 1737x2451

Анализ данных в музыке. Ритм жизни по плейлистам

PROTECT STATUS: not protected
The project is taking part in the competition

Для анализа я выбрал тему: «Когда мы слушаем музыку: ритм жизни по данным Spotify».

Описание проекта:

В рамках данного проекта я изучаю повседневные музыкальные предпочтения людей на основе данных, предоставленных Spotify. Для анализа был использован набор данных, содержащий информацию о времени прослушивания треков и продолжительности каждого сеанса.

Меня привлекла идея рассматривать музыку не как совокупность треков или жанров, а как индикатор ритма жизни. Интересно узнать, в какие моменты мы обращаемся к музыке, в какие дни и часы она становится частью нашей повседневной активности, и как изменяются наши привычки в течение недели.

Музыкальные предпочтения — это форма повседневного поведения, которую можно визуализировать, почти как «пульс» человека. Поэтому основное внимание в проекте уделено времени, регулярности и распределению активности, а не рейтингам или жанрам.

Этап работы:

Работа над проектом началась с загрузки датасета истории прослушиваний Spotify в Google Colab. Сначала я провёл первичный обзор данных: проверил размер таблицы, названия колонок и наличие пропусков. Поскольку в разных версиях Spotify-датасетов названия столбцов могут отличаться, я реализовал автоматический поиск ключевых колонок — времени прослушивания и длительности — чтобы код работал устойчиво и не зависел от конкретного формата файла.

Далее временные значения были преобразованы в формат datetime, а длительность прослушивания приведена к единой единице измерения — минутам. На этом этапе были удалены пустые строки и нулевые значения, чтобы визуализации не получались пустыми и отражали реальную активность. После очистки данных я создал дополнительные признаки, необходимые для анализа ритма жизни: час суток и день недели.

Затем данные были агрегированы под задачи каждого графика: суммарные минуты по часам, по дням недели, топ артистов по общему времени прослушивания, распределение длительности прослушиваний и матрица «день × час» для тепловой карты. После этого была настроена единая стилизация визуализаций в зелёной палитре: одинаковый фон, сетка, размеры шрифтов и цвета, чтобы все графики выглядели как часть одной инфографики. Финальным этапом стало формулирование выводов по каждому графику и общего вывода по проекту.

Стилистика и оформление графиков

Original size 1000x1500
Original size 1536x1024

Оформление таблиц

В проекте использовалась ограниченная зелёная цветовая палитра, заданная напрямую в коде визуализаций:

Тёмно-зелёный — #1B5E20 Использовался для заголовков, подписей осей, текста и акцентных элементов.

Основной зелёный — #2E7D32 Применялся для основных графических объектов: столбцов, линий и точек.

Светло-зелёный — #A5D6A7 Использовался для вспомогательных элементов и смягчения визуального контраста.

Светло-серый — #DDE6DD Применялся для сетки и второстепенных линий, чтобы не отвлекать внимание от данных.

Белый фон — #FFFFFF Использовался как основной фон всех графиков и слайдов для сохранения чистоты и читаемости.

Original size 1553x1058

Пример кода для настройки стиля

График 1. Музыкальная активность в течение дня

0

Пример кода\график

Первый график показывает, как меняется суммарное время прослушивания музыки в зависимости от часа суток.

По оси X отложены часы дня, по оси Y — общее количество минут прослушивания. Это базовая визуализация, которая задаёт общий ритм исследования.

Вывод: Музыкальная активность неравномерна в течение суток. Видны периоды повышенной активности в дневные и вечерние часы, тогда как ночью прослушивание минимально. Это подтверждает гипотезу о том, что музыка сопровождает активные фазы дня и практически отсутствует во время сна.

График 2. Музыкальная активность по дням недели

0

Пример кода/ график

Второй график показывает распределение времени прослушивания по дням недели. Для корректного сравнения дни были выстроены в логическом порядке — от понедельника к воскресенью.

Вывод: Активность прослушивания меняется в зависимости от дня недели. В рабочие дни музыка, вероятно, сопровождает повседневные задачи и фоновую деятельность, тогда как в выходные структура потребления может быть более свободной и менее регулярной. Музыка становится частью не только работы, но и отдыха.

График 3. Топ-10 артистов по времени прослушивания

Original size 736x981
0

График/пример кода

Третий график — горизонтальная столбчатая диаграмма, показывающая десять артистов, на которых приходится наибольшее суммарное время прослушивания.

В отличие от простого подсчёта количества треков, здесь используется именно время, что позволяет выявить устойчивые музыкальные предпочтения.

Вывод: Небольшое количество артистов формирует основу музыкального потребления. Это говорит о том, что музыкальные привычки часто строятся вокруг «якорных» исполнителей, к которым пользователь регулярно возвращается.

График 4. Распределение длительности прослушиваний

Четвёртый график — гистограмма, показывающая, как часто встречаются короткие и длинные прослушивания треков. Для улучшения читаемости экстремальные значения были ограничены.

Вывод: Основная масса прослушиваний укладывается в диапазон стандартной длины музыкального трека. Однако присутствие большого количества коротких прослушиваний может указывать на переключение между треками или пробное прослушивание, а длинные значения — на подкасты, лайвы или фоновое воспроизведение.

0

График\ пример кода

Original size 793x1200

График 5. Тепловая карта «день недели × час»

Пятый график объединяет два измерения — день недели и время суток — в виде тепловой карты. Интенсивность цвета показывает суммарное время прослушивания.

Вывод: Этот график наглядно демонстрирует индивидуальный ритм жизни. Видны устойчивые временные окна, в которые музыка появляется регулярно, а также различия между буднями и выходными. Музыкальное поведение оказывается тесно связано с расписанием дня.

0

График/ пример кода

Общий вывод по проекту

В ходе проекта было показано, что данные о прослушивании музыки могут быть использованы не только для анализа вкусов, но и для изучения повседневных ритмов жизни.

Музыка в данном контексте выступает как фоновая практика, сопровождающая работу, отдых и рутину. Через временные визуализации становится видно, что музыкальное потребление подчиняется чётким паттернам и повторяется изо дня в день.

Проект демонстрирует, как даже персональные данные небольшого объёма при правильной обработке и визуализации могут превратиться в осмысленное исследование повседневного поведения.

Использованные нейросети: 1. Chat GPT для генерации изображений и для запросов рекомендаций по улучшению кода и его написанию.

Original size 736x981
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more