
Введение
Мне было интересно проанализировать, как менялся рынок видеоигр на протяжении десятков лет — как менялось количество игр, выходивших ежегодно, какие жанры были самыми популярными, какие команды разработчиков создавали больше всего игр, насколько распространёнными были игр для различных операционных систем, на какой период года приходится релиз наибольшего количества игр.
Для анализа выбрал данные по играм с площадок Steam и GOG для различных операционных систем: Windows, Linux, DOS, Unix, OS X (за исключением игр, в которые на ПК можно поиграть только через эмулятор).
Датасет по играм взял с сайта Kaggle: https://www.kaggle.com/datasets/iamsouravbanerjee/computer-games-dataset
Для визуализации данных я выбрал следующие графики: линейчатый, круговой, точечный, гистограмму.
Самые популярные платформы

Круговая диаграмма
Проанализировал, какие платформы для выпуска игр на ПК были самыми популярными: оказалось, что подавляющее большинство игр выпускается в том числе на Windows, а эксклюзивно на Windows выходит 61,6% игр. Игр, которые в том числе выходят на macOS, оказалось 19,6%, а на Linux — 1,5%.
До исследования этих данных я уже знал, что большинство игр выходит именно на Windows, но для меня стало открытием, что разрыв между Linux и macOS оказался настолько существенным — в моём представлении обе ОС были сравнительно на одном уровне.
Количество релизов в год
Столбчатая диаграмма
Я проследил за тем, о скольких играх каждого года есть информация в данном датасете. Оказалось, что основной объём игр в датасете был выпущен между 1996 и 2018 годами.
Популярность жанров
Точечная диаграмма
Затем я изучил, какие жанры были самыми популярными на протяжении данного периода. Шутеры, ролевые игры и адвенчуры, ожидаемо, на вершине списка. Но меня удивило, что стратегий в реальном времени было так много.
Примечательно, что в 2013 году, на который пришлось наибольшее количество релизов из приведённого датасета, нет каких-либо явно доминируюших жанров. Конечно, шутеров всё ещё больше, но не настолько много, как это было в 2004 и 2007 годах. Так что распределение по жанрам было более равномерное.
Линейчатая диаграмма
Наконец, я проследил за тем, в какие месяцы игры чаще всего выпускаются — лидерам оказались осенние месяцы и март, что совпадает с моими ожиданиями. Но что меня удивило — это то, что июль настолько скуден на релизы по сравнению с соседними летними месяцами
Вывод
Анализ этих данных показал мне игры с другой стороны, не той, которую я привык видеть. Возможно, этот анализ поможет и мне однажды выпустить свою собственную игру, и эта информация пригодится для оценки ситуации на рынке.
Использование нейросетей
Для помощи по тому, как сделать стилизацию для графиков, я использовал модель GPT-4o mini. У этой модели я спрашивал, какие цвета ассоциируются с разными ОС, как сделать градиент от жёлтого к оранжевому в графике, как добавить свою картинку на фон.
Ссылка на нейросеть: https://duckduckgo.com/aichat
GPT-4o mini
Для создания изображений на фон диаграммы и обложки я использовал нейросеть Leonardo.AI.
Генерация фона для диаграммы. Leonardo.AI
Генерация обложки. Leonardo.AI
Блокнот и датасет