
Концепция
Waterparks — популярная американская поп-панк группа, активная с 2011 года. Их музыкальный стиль сильно менялся со временем, и прямо сейчас они находятся в новой переломной точке для своего творчества. Именно поэтому мне хочется проанализировать количество прослушиваний сквозь всю дискографию группы — мне было бы интересно соотнести получившиеся результаты с их новым релизом, когда он выйдет.
Для анализа я собрала датасет из треков, дат их выпуска, их отношения к альбому или эре, количеству прослушиваний на Spotify и других интересовавших меня параметров. Источники информации: Genius, Spotify, Kworb, страница Waterparks на Band Wiki и AZLyrics. Для форматирования данных я использовала ChatGPT:

Этапы работы
Для обработки данных я пользовалась ChatGPT. В промптах я указывала, какие данные из таблицы нужно проанализировать, к какому виду их привести и как оформить.

В процессе я корректировала промпты, чтобы уточнять детали графиков, править визуализацию и расширять или сужать выборку информации.
Стилизация
Для стилизации графиков я использовала цвета с обложек альбомов Waterparks, а так же шрифт, вдохновлённый почерком вокалиста Остена Найта, кириллическую версию (= модификацию найденного в интернете латинского шрифта) которого я сделала сама.
Графики
Первая диаграмма — линейная, чтобы быстро сравнить, какие релизы Waterparks набрали больше прослушиваний.
Этот график сильно меня расстроил, потому что крайний альбом Waterparks — Intellectual Property — на мой взгляд, самый сильный, и поэтому заслуживает намного большего внимания.
Порядок действий в коде выше (ChatGPT):
В случае Waterparks с помощью этого графика можно отследить и количество прослушиваний с течением времени: название каждого нового их релиза начинается со следующей буквы английского алфавита, поэтому альбомы легко рассортировать по порядку выхода.
Вторая диаграмма — точечный график популярности треков по датам релиза. Несмотря на то, что предыдущий график тоже даёт эту информацию, мне хотелось наглядно это подтвердить.
Третий график — тепловая карта. График показывает, какие по счёту внутри альбома треки набрали наибольшее количество прослушиваний.
Интересно, что сильнее всего здесь выделяются не самые популярные треки, а наименее популярный трек за всю дискографию группы — 7-й трек в альбоме FANDOM. Песня называется Group Chat и длится всего 14 секунд — в ней участники группы по очереди называют свои имена.
Порядок действий в коде (ChatGPT):
Четвёртый график — круговые диаграммы, показывающие долю топ-треков внутри альбомов.
Несмотря на то, что Greatest Hits, Entertainment и Intellectual Property набрали почти одинаковое количество прослушиваний, процент топ-треков внутри них сильно различается. Самый заслушанный по количеству песен альбом Waterparks — Double Dare, хотя в общем чарте он занимает только второе место.
Пятая диаграмма показывает соотношение прослушиваний и доли нецензурной лексики в текстах песен. Мне показалось интересным проанализировать это, потому что со временем тексты группы сильно поменялись, и я хотела посмотреть, отпугнуло ли это аудиторию.
Порядок действий в коде (ChatGPT):
Описание применения генеративной модели
В проекте я использовала ChatGPT 5.2 (https://chatgpt.com/) для структурирования данных и написания кода. Когда это было возможно с моим уровнем знания Питона, я правила форматирование кода самостоятельно. В других случаях я по нескольку раз переписывала промпты, чтобы получить более подходящий результат визуализации данных. Промпты я писала на английском языке, так как на нём у меня это получается успешнее. Примеры промптов приведены в проекте. Там, где нейросеть использовалась для генерации текста, я перепроверяла его на ошибки и делала сноски. Более подробно использование нейросети описано внутри проекта.
Материалы