
Описание
Для моего проекта я выбрала датасет содержащий информацию о музыкальных клипах по игре Minecraft. Датасет объединяет популярные музыкальные видеоролики по Minecraft и содержит 4 отдельных раздела и 140 записей.
Выбранные данные позволяют анализировать количество подписчиков, видеоколичество, количество просмотров, как соотносится количество просмотров на подписчика
Эта тема была выбрана мной так как Minecraft с детства была моей любимой игрой и является важной частью моего детства.
Для работы я взяла разные виды графиков, а именно столбчатая диаграма, которая показывает количество подписанных людей и выражает наиболее открытый интерес к работе Так же был использован линейный график, тепловая карта, ящик с усами Все это помогает провести подробный анализ
Этапы работы
Первым делом в блокноте подключаются основные библиотеки, а именно pandas и numpy для работы с датасетом, matplotlib и seaborn для настройки визуального оформления графиков. Библиотеки подключаются с помощью функции import.
Также в блокнот монтируется Google Drive (с помощью drive.mount, чтобы импортировать датасет и подключить шрифт, оба этих файла лежат на диске!

После этого нужно было подготовить данные. При помощи df.columns.str.replace были очищены названия столбцов и текстовых значений от возможных лишних пробелов или переносов.
Также символ №, часто встречающийся в датасете, был заменен на No, чтобы избежать проблем в коде.
Далее идет настройка визуального оформления. В первую очередь, с помощью matplotlib.font_manager был подключён шрифт Minecraft Ru, который используется в самой игре
Во втором этапе, был настроен единый стиль. Графикам я задала единый фон и цвет подписей, а также с помощью clean_axes отключила рамки и сетка, а так же была добавлена функция set_title, которая задаёт всем визуализациям заголовок в выбранном шрифте.
Так же была создана единая палитра цветов, которая будет использоваться во всех графиках, чтобы держать единый стиль системы
Ключевым первым шагом в анализе стало изучение структуры и содержания датасета. Для сравнения количества подписчиков, измерения видеоколичества, сравнения просмотров и выявления просмотров на подписчика использовались различные типы графиков.
В проекте были задействованы методы описательной статистики, включая подсчёт частот и агрегацию данных. Эти методы позволили наглядно продемонстрировать статистику авторов и активность зрителей касательно майнкрафт анимаций.
Итоговая визуалиция
Первый график показывает насколько каждый автор интересен людям и так же можно косвенно понять уровень контента на каналах и популярность определенного контента среди зрителей
Для анализа динамики интереса зрителей данные были предварительно приведены к числовому виду, после чего значения агрегировались по каналам. На основе этих данных был построен линейный график, который даёт возможность наглядно проследить, как менялась популярность каналов и интерпретировать траекторию интереса аудитории. просмотры это один из главных показателей заинтересованности зрителя
Ящик с усами


Тепловой график
Промты
Промпты для корректировки ошибок:
«Как сдвинуть график правее чтоб он был по середине?»
«Как подключить шрифт?»
Изображение было сгенерировано в нейросети ChatGPT.
промт; создай смешное изобрпжение свинки зи майнкрафт на фоне огня