
Пик популярности сериала «Игра престолов» от HBO давно прошел и остался в 2010-х, а Джордж Мартин так и не дописал «Ветра зимы» к любому из обещанных сроков. Однако франшизу все еще помнят как культовую, в том числе из-за репутации безжалостности к героям: любой из них может умереть задолго до финала. Мне стало интересно, как можно типологизировать данные по тому, насколько Вестерос (и автор) жестоки к персонажам. Это может быть интересно поклонникам «Игры престолов» и тем, кто еще не познакомился с ней, но наслышан о феномене — превращение фишки серии в структурированные данные.
Для данного анализа были использованы два датасета, найденных на платформе Kaggle:
Датасет по битвам — содержит информацию по всем крупным столкновениям из книг, включая кол-во атакующих и защищающихся участников, регион и место действия, а также показатели победы и проигрыша сторон.
Датасет по смертям героев — здесь наибольший интерес представляет информация по множеству персонажей, которым приписаны определенные характеристики: пол, класс, в какой книге и главе умирает персонаж.
Цветовая палитра
У «Игры Престолов» нет выраженной палитры, хотя у основных домов есть закрепленный за ними цветовой код. Чтобы на что-то опереться, я извлекла цвета из карты Вестероса с помощью Adobe Color, так как на этом изображении есть хорошая градация светлых и темных оттенок. Я оставила возможность немного менять финальные цвета для лучшей визуализации.
Также я добавила оттенки красного, цвета Таргариенов, светлый и темный, как акцентные, привлекающие внимание к самым важным элементам графиков.

Использованные типы графиков
Столбчатая диаграмма с накоплением и гистограмма — используются, когда необходимо продемонстрировать анализ двух показателей в сравнении друг с другом. Для сравнения персонажей по полу лучше подходит гистограмма, так как наглядно видна большая разница в значениях.
Рассеянные диаграммы — используются в тех случаях, когда важным фактором анализа является количественный, и хочется выделить его в визуализации. Также помогают ярче подчеркнуть выбивающиеся показатели.
Тепловая карта — используется для визуализации сравнительного анализа, где есть несколько количественных показателей, которые будет удобнее прочитать в виде таблицы.
Начало работы
Сначала импортируем и устанавливаем все нужные библиотеки, затем из репозитория GitHub выгружаем датасеты, проведем их проверки.
Также пишем код, который подготавливает среду для визуализации данных в стиле, где фон и элементы графика выполнены в тёмных и бежевых тонах, улучшая визуальную эстетику и читаемость будущих графиков. Настройка глобальных параметров графика происходит с помощью plt.rcParams.update ()
Столбчатая диаграмма и гистограмма
Для начала поработаем с общими характеристиками персонажей из датасета по смертям, которые подходят для сравнения: происхождение и пол. Предварительно удаляем для графиков лишние строки, не содержащие полезной информации.
Для происхождения эффективнее показать сравнение в процентом соотношении на столбчатой диаграмме с накоплением, а для пола — в количестве на обычной гистограмме, которая заодно даст нам представление о числе всех смертей в книгах.


Выходит, что за 5 книг в серии умерло 917 персонажей! При этом виден колоссальный разрыв в смертности между мужчинами и женщинами, что неудивительно, ведь в мире Вестероса воюют в основном мужчины.
Однако, несмотря на то, что основной каст персонажей принадлежит к благородным Домам, простолюдины все равно умирают на страницах чаще. По всей видимости, сюда включены все эпизодические персонажи, которые часто появляются лишь для того, чтобы быстро умереть, продемонстрировав жестокость мира к простому населению.
Рассеянные диаграммы
Теперь построим график рассеянной диаграммы для того, чтобы отследить смертность по годам. Я также добавила ограничение по датам, чтобы выделить наиболее релевантную информацию из столбца.
График показывает, что пик смертности героев приходится на 299 год — в это время происходят основные события книг «Битва королей» и «Буря мечей», рассказывающих о Гражданской войне в Вестеросе. Неудивительно, что именно в это время погибает больше всего людей.
Мне захотелось дополнить эту информацию с помощью датасета по битвам, посмотрев, какие регионы оказались самыми «горячими» точками для пребывания. Для этого было ранжировано количество битв, приходящееся на каждый регион.
Статистика показывает, что конфликт Вестероса сильнее всего бьет по Речным землям. Кажется, что война тяжелее всего дается именно сторонникам Севера и Старков. К концу войны этот край опустошен и несет огромные человеческие потери.
Тепловая карта
Важно не только, сколько битв случилось в регионе, но и количество участников, ведь это позволяет лучше оценить масштаб потенциальных человеческих потерей, особенно если силы противников неравные.
Для этой задачи сделаем тепловую карту, где будем сравнивать в столбцах количество атакующих и нападающих, при этом ранжировав эти данные по регионам.
Данный график подтверждает, что Речные земли — один из самых небезопасных регионов Вестероса, где встречаются равновеликие значительные войска. Интересно, что на Севере, втором по числу битв, в них участвует относительно мало народу, что говорит о рассеянности здесь людей, даже на контрасте с Западом, где, несмотря на низкое количество столкновений, сосредоточены большие массы.
Но особенно выделяется, конечно, мир за Стеной и территория Ночного дозора, где разница в силах атакующих и обороняющихся абсурдно колоссальна. Это действительно регион, откуда приходит самая серьезная угроза. К слову, вспомним соотношение погибших простолюдинов и дворян. Одичалые, как и многие братья Ночного дозора, не являются благородными, и можно предположить, что именно они вносят значительный вклад в потери среди «черни».
Использованные инструменты
ChatGPT — помощь и консультация по коду.
Krea — генерация обложки.
Carbon — оформление изображений кода.
Adobe Color — выделение цветов для палитры.