
— А вам раньше приходилось проигрывать войны? — Думаешь, я стал бы тем, кто я есть, если бы проигрывал войны?
Описание проекта
«Игра престолов» культовая история, которая известна каждому любителя фэнтези и сериалов. Вселенная этого произведения огромная и охватывает не один исторический период. Огромное количество имён, политически значимых локаций, названия оружия и хронологические периоды часто создают путаницу даже среди самых отчаянных знатоков вселенной. Для меня как в книгах, так и в сериале особенно привлекательным является эстетика средневекового сражения, политических игр и тенденция смены власти. Именно по этому мне было интересно провести аналитику всех сражений, которые упоминались в сериале и книге.
Цветовое решение


Мной было выбрано несколько референсов, которые вдохновили меня на дальней шее создание стилистического решения. С помощью сервиса Adobe Color я создала цветовую палитру.

Ход работы
Необходимые мне данные я нашла на сайте Kaggle.
Для дальнейшего анализа я использовала гистограммы просты и с группировкой, а так же гистограммы с накоплениями и круговую диаграмму. Использовала я их для удобства представления данных.
Для создания графических элементов я использовала некоторые библиотеки, такие как NumPy, Pandas, Matplotlib, Seaborn
После того, как я прочитала выбранные данные, я проанализировала её. Просмотрела столбцы, которые присутствуют в таблице и проверила какие типы данных хранятся в DataFrame. Затем я вывела статистику числовых данных. И для более полного понимания, с чем мне предстоит работать, я проверила таблицу на наличие пропущенных данных. В ходе анализа оказалось, что в некоторых столбцах пропущено подавляющее большинство данных. Поэтому, я выбрала ряд конкретных столбцов, которые помогут мне в при дальнейшем анализе.
Далее я попыталась избавиться от пропусков в столбцах для дальнейшей работы. Для этого я подставляла среднее значение столбцом. Кроме этого я заменила некоторые типы данных, чтоб облегчить их анализ.
После того, как я заменила пропуски на необходимые мне значения из таблицы, я приступила к аналитике.
Построение графиков
Я вывела пять наиболее часто встречающихся имён королей и составила столбчатую диаграмму:
- По оси X: именя королей, совершавшие атаки - Подключила сортировку для пяти самых часто встречающихся имён. - И в качестве палитры использовала свою раннее заданную гамму


Похожим образом я составила том 5 значений и столбца локации:
- нашла количество битв произошедшие в той или иной локации; - получила индекс пяти наименований, где чаще всего проводились сражения; - составила по этим данным график.
Далее я задала переменную most, которая содержит данные только из двух столбцов. В переменную m использовала для сортировки переменной most по убыванию и вывела топ 5 значений.
На основе этого я составила график, предварительно задав для оси X список с данными из столбца attacker_king, а для оси Y список с данными из столбца attacker_size.
По такому же алгоритму я собрала данные для армии защищающихся королей.
Назначила переменную dmost, объединив ею данные столбцов defender_king и defender_size. В переменной dm назвала отсортированный по убыванию список, из которого получила 5 часто упоминающийся имён
Для построения следующего графика я назначила оси:
- X: столбец attacker_king - Y: столбец battle_type
Чтобы составишь график победителей среди королей, я назначила переменную, которая будет обозначать отфильтрованный перечень королей. Будут отображаться только те, кто одерживал победу. Затем выбрала только два столбца: attacker_king и attacker_outcome. И считала уникальные значения для каждого имени, показывающие сколько раз оно упоминается. После этого я назначаю оси:
- X: содержит ключи из переменной w, то есть имена королей. - Y: содержит количество побед
Для того, чтоб понять, кто из королей преуспел в защите, я выделила в отдельную переменную данные о тех, кто проиграл при нападениях. Затем посчитала количество побед для защитников и назначила оси:
- X: список с листом из ключей (имён победителей) - Y: количество побед
Для наглядности так же преобразовала данные в круговую диаграмму.
Ссылки
Обложка сгенерирована с помощью FusionBrain.ai Цветовое решение сгенерировано с помощью Adobe Color Данные для анализа найдены на сайте Kaggle Ссылка на диск с кодом и базой данных