Original size 1140x1600

Хроника битв Вестероса

PROTECT STATUS: not protected
The project is taking part in the competition

Введение

«Игра престолов» — один из самых масштабных сериалов в современной поп-культуре. Его мир построен как полноценная вселенная со своей историей, географией, политикой и военными конфликтами.

У меня есть личная традиция пересматривать сериал на новогодних каникулах, поэтому эта история хорошо мне знакома. Благодаря этому я решила использовать именно этот материал для анализа данных и попробовать взглянуть на знакомый мир как на систему событий, которую можно изучать с помощью инструментов анализа данных.

big
Original size 1456x816

Источник данных для анализа

Вселенная «Игры престолов» содержит большое количество взаимосвязанных событий: битвы, регионы, временные периоды, победы и поражения сторон.

Это делает её удобным и наглядным примером для анализа: данные можно рассматривать как хронику альтернативной истории, где каждый конфликт — зафиксированное событие, поддающееся сравнению и визуализации.

В рамках данного проекта этот масштаб позволяет не просто построить отдельные графики, а показать целостную картину происходящих процессов.

big
Original size 1456x816

Открытый датасет «Game of Thrones» с платформы Kaggle.

Для анализа был использован открытый датасет Game of Thrones с платформы Kaggle. В работе использован файл battles.csv, содержащий информацию о сражениях: год, регион, место, участвующие стороны, исход битвы и размеры армий (частично).

Формат табличных данных позволяет применять стандартные инструменты анализа и визуализации в Python.

Исследовательские вопросы

В рамках проекта были сформулированы несколько вопросов:

— Как менялась интенсивность военных конфликтов с течением времени? — В каких регионах происходило наибольшее количество битв? — Как распределяются победы и поражения атакующих сторон по регионам? — Связана ли численность армии с вероятностью победы?

Эти вопросы задают структуру всей дальнейшей визуализации.

Original size 1456x816

Какие графики выбраны и почему

Для проекта были отобраны разные типы графиков, так как каждый из них отвечает за отдельный аспект анализа и помогает последовательно раскрыть масштаб и структуру событий во вселенной «Игры престолов».

Линейный график используется для отображения изменений во времени и позволяет увидеть, как менялась интенсивность военных конфликтов по годам.

Столбчатая диаграмма помогает сравнить регионы между собой и выявить территории с наибольшей концентрацией сражений.

Составной столбчатый график показывает не только общее количество битв, но и соотношение побед и поражений атакующей стороны внутри каждого региона.

Scatter-график используется для анализа взаимосвязи между численностью армий и исходом битвы, позволяя оценить влияние количественного превосходства на результат.

В совокупности эти визуализации формируют целостную картину происходящих процессов и позволяют рассматривать данные как систему взаимосвязанных событий, а не как набор отдельных показателей.

Original size 1456x816

Этапы работы

Работа над проектом была выстроена как последовательный процесс: от выбора и подготовки данных до анализа, визуализации и создания единого визуального нарратива.

Каждый этап был необходим для того, чтобы перейти от исходного массива информации к осмысленной системе графиков, объясняющих происходящие события во вселенной «Игры престолов». Особое внимание уделялось не только технической стороне анализа, но и тому, как данные могут быть представлены в визуально целостном и понятном формате.

Ниже представлены ключевые этапы работы с примерами кода и визуальных решений, использованных в проекте.

Файлы проекта

Подготовка и обработка данных

На этапе подготовки данных были выполнены следующие шаги:

— загрузка данных в Google Colab — первичный осмотр структуры таблицы и типов данных — приведение года и размеров армий к числовому формату — заполнение пропусков в категориальных полях — создание дополнительного признака, отражающего победу или поражение атакующей стороны

Эти шаги необходимы для корректной работы статистических методов и построения графиков.

Original size 2124x1280

Фрагмент кода: загрузка данных

Данные были загружены и проанализированы в среде Google Colab с использованием библиотеки Pandas.

Original size 1584x908

Фрагмент кода: осмотр данных

После загрузки данных был проведён первичный осмотр таблицы: изучены названия столбцов, типы данных и наличие пропусков.

Этот этап необходим для понимания того, какие данные можно использовать напрямую, а какие требуют дополнительной обработки.

Original size 2732x1952

Фрагмент кода: подготовка данных

На этапе «очистки и подготовки» данные были приведены к формату, удобному для анализа:

— год битвы преобразован в числовой формат — пропуски в категориальных признаках заменены на [Unknown] — исход битвы закодирован численно — размеры армий приведены к числовым значениям

Это позволило избежать ошибок при построении графиков и применении статистических методов.

Формирование аналитических выборок данных

После очистки данных были сформированы агрегированные таблицы, необходимые для визуализации:

— количество битв по годам — распределение битв по регионам — сводная таблица побед и поражений

Original size 2192x1504

Фрагмент кода: агрегация данных

Использовались базовые инструменты Pandas: [groupby], [value_counts], [pivot_table].

Визуализация данных

Для визуализации использовалась библиотека Matplotlib. Все графики были приведены к единому визуальному стилю с использованием глобальных настроек, чтобы обеспечить целостность инфографики.

Original size 1688x1652

Фрагмент кода: базовая настройка визуального стиля

Каждый тип графика был выбран исходя из задачи анализа: временной, категориальной или количественной.

Статистический анализ

Original size 2596x2324

Фрагмент кода: статистические методы

Помимо визуального анализа были применены базовые статистические методы:

— корреляция Пирсона для оценки связи между численным превосходством и исходом битвы — t-test (Welch) для сравнения средних размеров армий в победах и поражениях

Это позволило количественно подтвердить наблюдаемые визуальные закономерности.

Визуальное сопровождение и стилизация изображений

Для усиления нарративной части проекта были использованы стилизованные изображения, полученные с помощью нейросети Midjourney. Кадры из сериала были приведены к единому визуальному языку, совпадающему с цветовой палитрой и стилем графиков.

Это позволило объединить аналитическую и визуальную части проекта в цельную историю.

Original size 2790x1174

Промт для генерации изображений в Midjourney

График 1. Динамика количества битв по годам

Что показывает график Данный график отражает изменение количества зафиксированных сражений во вселенной «Игры престолов» в разные годы. Он позволяет рассмотреть, как менялась интенсивность военных конфликтов с течением времени.

Почему выбран именно этот тип графика Линейный график наиболее подходит для анализа временных рядов, так как наглядно показывает рост, спад и пиковые значения. В контексте проекта он позволяет воспринимать войну как процесс, развивающийся во времени, а не как набор отдельных эпизодов.

Original size 1395x801

График «Динамика количества битв по годам»

Original size 2192x1428

Фрагмент кода для 1 графика

На что стоит обратить внимание — наличие периодов с резким увеличением числа битв — неравномерное распределение конфликтов по годам — визуально выделяющиеся пики, соответствующие ключевым этапам сюжета

Вывод Военные события распределены по времени неравномерно, что подчёркивает этапность конфликта и наличие периодов эскалации.

График 2. Регионы с наибольшим числом битв

Что показывает график График демонстрирует распределение битв по регионам и позволяет определить территории, в которых происходило наибольшее количество сражений.

Почему выбран именно этот тип графика Столбчатая диаграмма подходит для сравнения категориальных данных. Горизонтальный формат был выбран для повышения читаемости, так как названия регионов достаточно длинные.

Original size 1395x801

График «Регионы с наибольшим числом битв»

Original size 3104x1280

Фрагмент кода для 2 графика

На что стоит обратить внимание — заметное доминирование нескольких регионов — резкий спад количества битв за пределами ключевых территорий — концентрация конфликтов в определённых частях мира

Вывод Война во вселенной сериала сосредоточена в ограниченном числе регионов, которые можно рассматривать как основные зоны конфликта.

График 3. Победы и поражения атакующей стороны по регионам

Что показывает график Составной столбчатый график отображает не только общее количество битв в каждом регионе, но и структуру их исходов: победы и поражения атакующей стороны.

Почему выбран именно этот тип графика Составной график позволяет одновременно анализировать: — абсолютное количество событий — соотношение различных исходов внутри одной категории

Это делает его более информативным по сравнению с обычной столбчатой диаграммой.

Original size 1395x801

График «Победы и поражения атакующей стороны по регионам»

Original size 2396x2024

Фрагмент кода для 3 графика

На что стоит обратить внимание — различие в структуре исходов между регионами — регионы, где атакующая сторона побеждает чаще — регионы с более сбалансированными исходами

Вывод Характер военных действий и их результаты отличаются в зависимости от региона, что указывает на неоднородность конфликта.

График 4. Соотношение численности армий и исход битвы

Что показывает график Scatter-график отображает соотношение численности армий атакующей и защищающейся сторон в отдельных сражениях. Цвет точек отражает исход битвы для атакующей стороны.

Почему выбран именно этот тип графика Scatter-график подходит для анализа взаимосвязей между количественными переменными. Он позволяет увидеть распределение отдельных наблюдений и выявить возможные закономерности.

Original size 1395x801

График «Соотношение численности армий и исход битвы»

Original size 2596x2396

Фрагмент кода для 4 графика

На что стоит обратить внимание — расположение точек относительно диагонали равных сил — случаи побед при численном меньшинстве — отсутствие жёсткой линейной зависимости

Вывод Численное превосходство увеличивает вероятность победы, однако не гарантирует её, что указывает на влияние дополнительных факторов.

Использование ИИ

В процессе работы над проектом для поиска информации, подбора и анализа источников данных, а также для помощи в структурировании презентации и формулировании текстовых пояснений использовался инструмент ChatGPT.

ChatGPT (OpenAI): https://chat.openai.com

Для создания визуального сопровождения проекта, включая обложку и стилизованные графические элементы, был использован сервис Midjourney. С его помощью были получены изображения, поддерживающие выбранный визуальный язык и общую атмосферу проекта.

Midjourney: https://www.midjourney.com

Original size 1456x816

Итоги и выводы

В рамках проекта вселенная «Игры престолов» была рассмотрена как структурированная система событий, которую можно анализировать с помощью инструментов работы с данными. Использование табличного датасета позволило проследить временную динамику конфликтов, их географическое распределение и структуру исходов.

Анализ показал, что военные события распределены по времени неравномерно и сосредоточены в ограниченном числе регионов, которые выступают основными зонами конфликта. Результаты сражений отличаются в зависимости от региона, что подчёркивает неоднородность происходящих процессов.

Original size 1456x816

Статистический анализ подтвердил, что численное превосходство армии повышает вероятность победы, однако не является определяющим фактором. Это указывает на влияние дополнительных условий, таких как стратегия, местность и контекст событий.

Единый визуальный стиль и использование стилизованных изображений позволили представить данные не как набор графиков, а как визуальную хронику. Проект демонстрирует, что анализ данных может служить инструментом не только для поиска закономерностей, но и для повествования, объединяя аналитику и визуальный сторителлинг.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more