
Выбор данных
Поскольку моя основная специальность — гейм-дизайн, в данной работе я решила осуществить анализ рынка видеоигр на 2024 год.
Ключевыми факторами для оценки успешности проекта, на мой взгляд, являются прежде всего финансовые показатели. Несмотря на высокую активность аудитории в игровой индустрии, её мнение часто оказывается предвзятым вследствие социальных факторов, что может приводить к намеренному искажению восприятия. В отличие от субъективных оценок, объемы продаж позволяют получить наиболее объективное представление об успехе видеоигр в контексте массовых развлечений.
Этапы работы
Подготовка

Для работы мне понадобилось импортировать следующие библиотеки.
Кроме того, для поддержания общего стиля диаграмм я выбрала и установила как базовый новый шрифт — Helvetica.


Затем считала датасет и проверила правильность вывода.
Оценки критиков
Обозначим гипотезу — оценка критиков один из наименее информативных параметров оценки игры, особенно в вопросе выручки. Это видно на графике: средний показатель колеблется в районе 6-8, однако далеко не все игры, оцененные так, имеют коммерческий успех.
Динамика рынка
Затем я решила проанализировать динамику состояния рынка: для этого нужно узнать, в каких годах были выпущены наиболее успешные игры.
На графике виден яркий всплеск с пиком в 2008 году, до и после которого наблюдаются падения. Рассмотрим более детально период с 2005 по 2015 — какие именно игры-бестселлеры составили большую часть продаж.
Топ-жанры
Топ-10 игр. Продажи по регионам
Затем я решила рассмотреть региональные продажи для топ-10 игр в выбранном промежутке: какие регионы платят больше всего?
Ожидаемо, это оказалась Северная Америка — это стандартное состояние для игровой индустрии (как и показывает график для игр разных лет).
Топ-10 консолей
Интересно и разбиение продаж по консолям. Здесь видна интересная динамика классического противостояния Xbox и Playstation: продажи с PS составляют последовательный градиент, т. к. выпускаются чаще, в то время как Xbox’ы гораздо более непоследовательны.
Использованный датасет и код
Описание применения генеративной модели
Для решения проблем с кодом для последней диаграммы использовалась нейросеть ChatGPT 4-o. Prompt (GPT): I have a dataframe with columns 'console' (ten different consoles), 'year' (year when game was released) and 'total_sales' (how many sales of the game in millions). I want to make an area plot with year as x-axis and total sales (summed up for each console) as y-axis.
Для создания обложки проекта была использована нейросеть Midjourney 6.0. Prompt (MJ): minimalistic poster, keyboard WASD buttons, black and white Постобработка — Photoshop.