
Концепция
В проекте проанализирован датасет игр, выпущенных с 1980-х и по наше время. Мне захотелось выделить именно ретро-игры до 1999 года и исследовать их популярность, жанры и ключевые тенденции. Итак, Press start!

Мудборд
Вдохновением для оформления проекта стала эстетика классических аркадных игр. Цветовая палитра и стиль визуализации отсылают к игровым автоматам и консольным играм 80-х и 90-х. В проекте использован шрифт Nineteen Eighty Seven, который полностью поддерживает эстетику.

В ходе исследования были использованы данные с сайта Kaggle. Датасет содержит названия игр, годы выпуска, жанры, количество играющих, саммари и даже отзывы.
Мне захотелось сфокусироваться на:
Обработка данных
Были импортированы библиотеки pandas, numpy, matplotlib.pyplot и matplotlib.font_manager. Отдельно были подгружены датасет и шрифт в виде файлов.
Мне понадобилось преобразовать дату выпуска игр в формат datetime для более удобной работы. А игры нужно было отфильтровать до 1999 года включительно. С помощью ChatGPT код был доработан: ИИ добавил небольшую часть кода errors='coerce', чтобы защитить его от ошибок, так как в таблице были иногда пропущены даты.
Визуализация
Линейный график. Количество выпущенных игр по годам
Для начала мне захотелось понять, как много игр в целом выпускалось как до 2000 года, так и после. График выше показывает, как менялось количество выпущенных игр по годам, начиная с самых ранних релизов. Так стали понятны примерные тенденции роста и спада и возможные всплески популярности видеоигр.
Гистограмма. Топ-15 жанров игр
Можно заметить, что в ретро-играх был наиболее популярен RPG, а также жанры шутер и приключение. Аркады заняли последнее место, несмотря на то что они были невероятно популярны в 80-х. Полагаю, что из-за специфики данных датасета (фокус на консольные и ПК-игры) аркадные игры оказались просто недопредставлены.
Точечный график. Топ-15 игр, в которые до сих пор играют
А этот график позволил понять, что у старых игр до сих пор очень большая аудитория. Многие игры, такие как Zelda или Half Life остаются культовыми.
Облако слов. Самые популярные слова в отзывах
Мне захотелось проанализировать самые часто встречающиеся слова в отзывах и сделать для этого как график, так и облако слов. Для этого мне пришлось обратиться к ChatGPT, чтобы он помог мне избавиться от слов-паразитов, коротких слов, предлогов, местоимений и т. д.
Точечный график. Самые популярные слова в отзывах
В виде точечного графика статистика становится еще более наглядной. Очевидно, что чаще всего такие игры находят веселыми и считают их идеальными для того, чтобы приятно занять свободное время. К Марио, кстати, повышенный интерес.
Круговая диаграмма. Самые частые слова в названиях игр
А что-то такое получилось с названиями самих игр. Это дает понять, что у каких-то игр крупные серии, так как ключевые слова попадают в подобную диаграмму.
Линейный график. Популярность определенных жанров
Такой график позволил понять, что наибольшую популярность со временем приобрел жанр приключений. А вот RPG и платформеры делали уже не так активно.
Описание применения генеративной модели
Ideogram — генерация обложки. Промпт: pixel art illustration of two retro game style characters fighting on a dark background. The characters have neon colors and simple icon style Chat GPT — помощь в дополнении и расширении кода, проверка кода, улучшение кода и устранение ошибок и опечаток (см. также экраны 8 и 18). Он также помог написать часть кода для диаграмм, где требовалась фильтрация слов и скачивание стоп-слов Upscayl — увеличение изображений Recraft.ai — генерация изображения для палитры. Промпт: pixel art illustration pattern of retro games icons in neon colors
Ссылка на блокнот и датасет
Ссылка на блокнот и датасет: https://drive.google.com/drive/folders/1p3hqFqLhb6LvIXRY7wcmKZWEP6gYyES1?usp=sharing Ссылка на датасет в Kaggle: https://www.kaggle.com/datasets/arnabchaki/popular-video-games-1980-2023