
Я выбрал Videogame Sales Dataset — один из самых популярных датасетов на Kaggle, содержащий информацию о продажах компьютерных игр по всему миру с 1980-х годов по 2016 год.
Датасет включает 16,598 записей о видеоиграх с 11-ю атрибутами: рейтинг, название, платформа, год выпуска, жанр, издатель, продажи в Северной Америке, Европе, Японии, других регионах и общие мировые продажи. Временной охват: 1980–2016 годы
Почему именно эти данные? Меня как любителя компьютерных игр привлекли несколько аспектов: Историческая ценность — возможность проследить эволюцию игровой индустрии за 36 лет Географический охват — понимание региональных предпочтений игроков Коммерческий интерес — какие игры стали бестселлерами и почему
Я решил создать 4 уникальных типа диаграмм, каждый из которых раскрывает разные аспекты данных:
«ГЕОКУБ» (Круговая диаграмма) — показывает региональное распределение продаж для топ-10 игр
«ПУЗЫРЬКОВЫЙ ЛЕС» (Древовидная диаграмма) — визуализирует популярность жанров по платформам
«ПАУТИНА ВРЕМЕНИ» (Радиальная диаграмма) — отображает динамику продаж по годам
«НЕБОСКРЕБЫ» (Многоуровневая столбчатая диаграмма) — демонстрирует успех издателей по регионам


Использование нейросетей Для этой работы я использовал DeepSeek для: оптимизации кода и решения проблем с отображением, а также генерации креативных идей.
Примеры промптов: «Как сделать круговую диаграмму с 3D-эффектом в matplotlib?» «Почему метки выходят за границы графика и как это исправить?» «Создай цветовую схему в стиле киберпанк для графиков»
Ключевые выводы из анализа
Лидер рынка: Nintendo доминирует с 7 из 10 самых продаваемых игр
Региональные предпочтения: ‣ Япония — RPG и симуляторы ‣ Северная Америка — Экшн и шутеры ‣ Европа— Спорт и гонки
Пик индустрии: 2008–2010 годы — золотая эра консольных игр
Успешные франшизы: Pokémon, Mario, Call of Duty, Grand Theft Auto
Что я узнал:
Научился преобразовывать экранные координаты в data-координаты, что позволило динамически позиционировать элементы относительно друг друга и избегать перекрытий.
Освоил создание взрывных круговых диаграмм с ручным позиционированием меток, работу с полярными координатами для радиальных графиков и использование библиотеки squarify для древовидных диаграмм с кастомными границами и прозрачностью.
Реализовал алгоритм автоматического размещения меток, который определяет доступное пространство и выбирает оптимальное выравнивание (слева/справа) в зависимости от позиции легенды и границ графика.
Скачать блокнот Google Collab можно тут