Original size 2000x2997

Honkai: Star Rail анализ данных

The project is taking part in the competition

Описание проекта

Выбор данных Для проекта был выбран набор данных «Honkai: Star Rail Characters Dataset (v2.6)» с сайта Kaggle. Файл starraildata.csv содержит подробную информацию о 60 игровых персонажах, включая их редкость, принадлежность к игровым мирам, стихию, путь и базовые боевые характеристики (HP, ATK, DEF, SPD).

Почему это интересно? 1. Honkai: Star Rail — это игра с глубокой математической составляющей. Анализ этих данных позволяет:

2. Увидеть реальный баланс между «платными» (5★) и «бесплатными» (4★) персонажами.

3. Выявить дефицитные комбинации ролей и стихий.

Наглядно подтвердить явление Power Creep (постепенное завышение характеристик новых героев).

Выбранные типы визуализации: 1.Круговая диаграмма: Идеальна для показа долей Путей в общем ростре.

2.Точечная диаграмма (Strip Plot): Позволяет увидеть плотность распределения стихий по ролям и найти «пустые клетки».

3.Линейный график: Использован для визуализации рейтинга (Топ-10) и демонстрации разрыва в показателях силы.

4.Столбчатая диаграмма: Самый четкий способ сравнить количество персонажей разной редкости.

Стилизация

Источником вдохновения послужил интерфейс и меню персонажей в HSR.

Палитра: Темно-синий фон космической бездны (0C1220), акцентный золотой цвет билетов прыжка (D3AD7F) и неоновые цвета элементов.

Original size 830x341

График 1

Круговая диаграмма демонстрирует структурный баланс игровых ролей. На графике видно, что «боевые» пути (Разрушение, Охота, Эрудиция) суммарно составляют более 50% всего ростера. Это подтверждает фокус игры на разнообразии способов нанесения урона. Самым малочисленным на данный момент является путь Изобилия, что делает каждого нового персонажа этого типа стратегически важным для игроков.

Original size 605x602

Original size 665x156

Использованный метод:

Частотный анализ (Frequency Analysis): Группировка данных по категориальному признаку path и вычисление процентной доли каждой категории относительно общего объема выборки (N=60).

График 2

Данная визуализация позволяет выявить «белые пятна» в гейм-дизайне. Каждая точка — это персонаж. Мы видим высокую плотность в определенных комбинациях и полное отсутствие персонажей в других (например, Квантовая Гармония в данной версии). Вывод: Анализ матрицы помогает предсказывать будущих персонажей, так как разработчики стремятся закрыть пустующие ниши для создания игрового разнообразия.

Original size 1066x572

Original size 608x147

Использованный метод:

Категориальное сопоставление (Categorical Mapping): Метод визуализации пересечения двух качественных признаков (element и path) для выявления плотности распределения объектов внутри многомерной структуры.

График 3

Линейный график ранжирует героев по их атакующему потенциалу. Пики на графике соответствуют лимитированным персонажам 5★ (таким как Dr. Ratio с атакой 776). Вывод: Наблюдается четкая корреляция между редкостью персонажа и его базовыми статами. Средний разрыв в силе между топом и «замыкающими» персонажами списка составляет более 40%, что визуализирует вертикальную прогрессию силы в игре.

Original size 1005x597

Original size 853x221

Использованный метод:

Анализ экстремальных значений (Outlier Detection): Сортировка количественного признака base_ATK и выделение верхнего дециля выборки для определения лидеров по эффективности.

График 4

Столбчатая диаграмма наглядно показывает экономическую модель игры. Количество 5★ персонажей (37) уже значительно превышает количество 4★ персонажей (23). Вывод: Это свидетельствует о том, что Honkai: Star Rail ориентирована на выпуск уникального контента премиум-класса. С точки зрения статистики, «легендарный» статус становится стандартом для новых героев, смещая баланс в сторону более дорогих и мощных юнитов.

Original size 686x549

Original size 831x151

Использованный метод:

Описательная статистика (Descriptive Statistics): Количественное сравнение непересекающихся групп по признаку rarity.

Методология

В данном проекте анализ проводился с использованием библиотеки Pandas для обработки данных и библиотек Matplotlib/Seaborn для визуализации. Были применены следующие этапы обработки:

Data Cleaning (Очистка): Исправление опечаток (например, «Lighting» → «Lightning») и унификация строк (удаление артикля «The» перед путями) для корректной группировки.

Aggregation (Агрегация): Расчет средних значений (mean) и медиан для сравнения характеристик персонажей разной редкости.

Styling (Стилизация): Применение пользовательской цветовой палитры (HEX-коды: 0C1220, D3AD7F, C082FF) для приведения графиков к консистентному инфографическому стилю игры.

Вывод

В ходе выполнения проекта был проведен комплексный анализ и визуализация данных ростера Honkai: Star Rail версии 2.6. Исследование подтвердило, что за визуальной эстетикой игры стоит строгая математическая структура, определяющая игровой опыт.

Ключевые результаты анализа:

1. Экономика и редкость: Исследование количественного состава персонажей показало явный приоритет в сторону 5★ героев (более 60% выборки). Статистика базовых характеристик подтвердила преимущество легендарных персонажей: их средняя атака выше на ~10.5%, что обосновывает их ценность в рамках гача-системы.

2. Эволюция характеристик (Power Creep): Линейный анализ топовых показателей выявил тенденцию к росту базовых статов у новых героев. Пиковые значения (например, у Dr. Ratio) задают новый стандарт силы, что подтверждает гипотезу о постепенном завышении характеристик для поддержания интереса к новым баннерам.

3. Структурные пробелы: Матричный анализ элементов и путей позволил наглядно увидеть «дефицитные зоны». Выявленные пустые ячейки в комбинациях ролей являются потенциальными точками роста для будущих обновлений игры.

Данный проект демонстрирует, как инструменты Data Science (Python, Pandas) позволяют деконструировать игровые механики и оценивать баланс в современных высокобюджетных играх. Полученные результаты могут быть использованы для прогнозирования мета-гейма и понимания стратегии развития игры.

Использованные в проекте инструменты

1. Google Colab Обработка данных, визуализация графиков

2. Kaggle Поиск датасета

3. Google Gemini 3 Генерация и исправления кода, помощь в выборе визуального стиля

4. Библиотеки Python (Pandas, Matplotlib, Seaborn)

Блокнот и датасет

Ulyana Kosar

data visualization

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...