
Описание проекта
Выбор данных Для проекта был выбран набор данных «Honkai: Star Rail Characters Dataset (v2.6)» с сайта Kaggle. Файл starraildata.csv содержит подробную информацию о 60 игровых персонажах, включая их редкость, принадлежность к игровым мирам, стихию, путь и базовые боевые характеристики (HP, ATK, DEF, SPD).
Почему это интересно? 1. Honkai: Star Rail — это игра с глубокой математической составляющей. Анализ этих данных позволяет:
2. Увидеть реальный баланс между «платными» (5★) и «бесплатными» (4★) персонажами.
3. Выявить дефицитные комбинации ролей и стихий.
Наглядно подтвердить явление Power Creep (постепенное завышение характеристик новых героев).
Выбранные типы визуализации: 1.Круговая диаграмма: Идеальна для показа долей Путей в общем ростре.
2.Точечная диаграмма (Strip Plot): Позволяет увидеть плотность распределения стихий по ролям и найти «пустые клетки».
3.Линейный график: Использован для визуализации рейтинга (Топ-10) и демонстрации разрыва в показателях силы.
4.Столбчатая диаграмма: Самый четкий способ сравнить количество персонажей разной редкости.
Стилизация
Источником вдохновения послужил интерфейс и меню персонажей в HSR.
Палитра: Темно-синий фон космической бездны (0C1220), акцентный золотой цвет билетов прыжка (D3AD7F) и неоновые цвета элементов.

График 1
Круговая диаграмма демонстрирует структурный баланс игровых ролей. На графике видно, что «боевые» пути (Разрушение, Охота, Эрудиция) суммарно составляют более 50% всего ростера. Это подтверждает фокус игры на разнообразии способов нанесения урона. Самым малочисленным на данный момент является путь Изобилия, что делает каждого нового персонажа этого типа стратегически важным для игроков.
Использованный метод:
Частотный анализ (Frequency Analysis): Группировка данных по категориальному признаку path и вычисление процентной доли каждой категории относительно общего объема выборки (N=60).
График 2
Данная визуализация позволяет выявить «белые пятна» в гейм-дизайне. Каждая точка — это персонаж. Мы видим высокую плотность в определенных комбинациях и полное отсутствие персонажей в других (например, Квантовая Гармония в данной версии). Вывод: Анализ матрицы помогает предсказывать будущих персонажей, так как разработчики стремятся закрыть пустующие ниши для создания игрового разнообразия.
Использованный метод:
Категориальное сопоставление (Categorical Mapping): Метод визуализации пересечения двух качественных признаков (element и path) для выявления плотности распределения объектов внутри многомерной структуры.
График 3
Линейный график ранжирует героев по их атакующему потенциалу. Пики на графике соответствуют лимитированным персонажам 5★ (таким как Dr. Ratio с атакой 776). Вывод: Наблюдается четкая корреляция между редкостью персонажа и его базовыми статами. Средний разрыв в силе между топом и «замыкающими» персонажами списка составляет более 40%, что визуализирует вертикальную прогрессию силы в игре.
Использованный метод:
Анализ экстремальных значений (Outlier Detection): Сортировка количественного признака base_ATK и выделение верхнего дециля выборки для определения лидеров по эффективности.
График 4
Столбчатая диаграмма наглядно показывает экономическую модель игры. Количество 5★ персонажей (37) уже значительно превышает количество 4★ персонажей (23). Вывод: Это свидетельствует о том, что Honkai: Star Rail ориентирована на выпуск уникального контента премиум-класса. С точки зрения статистики, «легендарный» статус становится стандартом для новых героев, смещая баланс в сторону более дорогих и мощных юнитов.
Использованный метод:
Описательная статистика (Descriptive Statistics): Количественное сравнение непересекающихся групп по признаку rarity.
Методология
В данном проекте анализ проводился с использованием библиотеки Pandas для обработки данных и библиотек Matplotlib/Seaborn для визуализации. Были применены следующие этапы обработки:
Data Cleaning (Очистка): Исправление опечаток (например, «Lighting» → «Lightning») и унификация строк (удаление артикля «The» перед путями) для корректной группировки.
Aggregation (Агрегация): Расчет средних значений (mean) и медиан для сравнения характеристик персонажей разной редкости.
Styling (Стилизация): Применение пользовательской цветовой палитры (HEX-коды: 0C1220, D3AD7F, C082FF) для приведения графиков к консистентному инфографическому стилю игры.
Вывод
В ходе выполнения проекта был проведен комплексный анализ и визуализация данных ростера Honkai: Star Rail версии 2.6. Исследование подтвердило, что за визуальной эстетикой игры стоит строгая математическая структура, определяющая игровой опыт.
Ключевые результаты анализа:
1. Экономика и редкость: Исследование количественного состава персонажей показало явный приоритет в сторону 5★ героев (более 60% выборки). Статистика базовых характеристик подтвердила преимущество легендарных персонажей: их средняя атака выше на ~10.5%, что обосновывает их ценность в рамках гача-системы.
2. Эволюция характеристик (Power Creep): Линейный анализ топовых показателей выявил тенденцию к росту базовых статов у новых героев. Пиковые значения (например, у Dr. Ratio) задают новый стандарт силы, что подтверждает гипотезу о постепенном завышении характеристик для поддержания интереса к новым баннерам.
3. Структурные пробелы: Матричный анализ элементов и путей позволил наглядно увидеть «дефицитные зоны». Выявленные пустые ячейки в комбинациях ролей являются потенциальными точками роста для будущих обновлений игры.
Данный проект демонстрирует, как инструменты Data Science (Python, Pandas) позволяют деконструировать игровые механики и оценивать баланс в современных высокобюджетных играх. Полученные результаты могут быть использованы для прогнозирования мета-гейма и понимания стратегии развития игры.
Использованные в проекте инструменты
1. Google Colab Обработка данных, визуализация графиков
2. Kaggle Поиск датасета
3. Google Gemini 3 Генерация и исправления кода, помощь в выборе визуального стиля
4. Библиотеки Python (Pandas, Matplotlib, Seaborn)