
Введение
Видеоигры — одна из самых популярных форм медиа в наше время. Множество людей играют в них, некоторые даже создают карьеру, другие воспринимают это как свое хобби, или создают их.
Для каждой группы довольно важно знать, какие игры популярны сейчас, а какие считались лучшими в прошлом или настоящем. Из-за этого появляется востребованность в оценке видеоигр, ведь мнение большинства — значимый источник информации. Оно может быть как отражением текущих/прошлых трендов, так и иметь авторитет при выборе новой игры для прохождения, что может сильно сказаться на продажах и популярности.
В этом контексте, данные об оценках игр становятся ценным ресурсом для понимания не только качества отдельных продуктов, но и общих трендов в индустрии, предпочтений аудитории и успешных стратегий разработчиков.
Выбор данных
Я проанализировал датасет IGN (Internet Games Network) — архив оценок видеоигр от одного из самых авторитетных игровых медиа. Датасет охватывает период с 1996 по 2013 год и содержит информацию о более чем 1400 играх.
Датасет был взят из Kaggle — онлайн-платформы по анализу данных и машинному обучению, которая предоставляет разнообразные образовательные датасеты.
Ценность данных
Ценность данных обусловлена тем, что датасет отражает мнение пользователей и редакторов одной из самых влиятельных платформ игровых медиа — IGN, которая и по сей день влияет на коммерческий успех игр.
Для игроков: Понимание исторического контекста и эволюции видеоигр
Для разработчиков: Анализ факторов, связанных с высокими оценками
Для инвесторов: Выявление успешных стратегий
Для исследователей: Изучение трендов в игроиндустрии
Графики
Стилизация основана на простоте визуализации и ясности, единой цветовой палитре и цветовых ассоциациях с платформами (Nintendo — красный, PC — синий и т. д.)
Код для стилизации
Для анализа я выбрал 4 типа графиков, каждый из которых решает конкретные задачи:
Гистограмма показывает, как в целом распределены оценки игр. Также она помогает понять, какие оценки считаются высокими или низкими, и сравнить среднюю оценку с наиболее частой.
Из этого графика видна тенденция к более положительным оценкам, нежели к негативным. Средняя оценка для видеоигр ~7, оценки выше или ниже встречаются реже всего.
Код для графика 1
Диаграмма поможет сравнить, какие платформы получают в среднем лучшие оценки. Также она показывает выборку, то есть сколько всего игр с платформы было оценено.
Из этого графика видно, что больше всего игр на то время были доступны на консолях Xbox, Nintendo и телефонах, из-за чего средняя оценка игр на этих платформах становится более правдоподобной.
Код для графика 2
Этот график показывает, как менялось среднее качество игр год за годом. Он также помогает увидеть связь между качеством и количеством выпускаемых игр, выявляя долгосрочные тенденции в индустрии.
Из этого графика видна тенденция на более высокие оценки в годах с меньшим количеством обзоров на игры. 2008 год с самым большим количеством обзоров (1915) показывает более усредненную оценку, нежели другие года.
Код для графика 3
График помогает оценить, насколько игры «Выбора редакции» отличаются от остальных на сайте по качеству. Он показывает разницу в оценках и доказывает, что это различие статистически значимо.
По графику можно явно сделать вывод, что игры «Выбора редакции» будут пользоваться большим спросом, ведь их оценки намного выше оценок обычных игр.
Код для графика 4
Использование нейросетей
Нейросети использовались в основном для помощи в написании кода для графиков. Также нейросеть помогла найти библиотеки, нужные для графиков и устранить некоторые ошибки кода, возникшие при его написании
Использованная нейросеть: DeepSeek
Пример промпта: Разработай цветовую палитру для дэшборда анализа видеоигр, которая: 1. Включает цвета основных игровых платформ, представленных в прикрепленном файле (PlayStation синий, Xbox зеленый, Nintendo красный) 2. Имеет контрастные цвета для категорий оценок (Amazing, Great, Good и т. д.) 3. Содержит нейтральные фоновые цвета для хорошей читаемости (белый/серый) Напиши оптимальный код на Python с использованием библиотек matplotlib/seaborn, который создаст такую визуализацию.