

Введение
На протяжении всей своей истории человечество сопровождали смертоносные эпидемии, уносившие миллионы жизней. Такие события служат мощнейшим катализатором перемен, показывая, насколько уязвимы люди и человечество в целом, но одновременно меняя экономику, ускоряя научный и социальный прогресс. Часто об эпидемиях говорят эмоционально, но как эти трагедии выглядят в цифрах? Как менялась летальность болезней? В этой работе я попыталась это выяснить. Мой выбор пал на данную тему, потому что это социально-глобальная и вечно актуальная проблема, которой необходимо придать огласку.

Мудборд
Работа с кодом
Чтобы ответить на эти вопросы, напишу код для работы с датасетами. В первую очередь я загрузила и отчистила файлы для дальней работы.
import pandas as pd import numpy as np import re import matplotlib.pyplot as plt
df1 = pd.read_csv («df_1.csv») df2 = pd.read_csv («df_2.csv»)
Самая высокая смертность
pcts = (top10['deaths']/top10['deaths'].sum ()*100).round (1) Процентное распределение
В итоге у меня получился список десяти самых смертоносных болезней в истории. Безусловно, первое и третье места занимают чума в разных своих поколениях — Юстинианова чума и Чёрная смерть. Это, пожалуй, самая опустошительная болезнь за всю историю человечества, выкосившая в своей самой мощной волне до половины населения Европы.
На втором месте находится испанский грипп. Он обрушился на мир, уже истощённый Первой мировой войной, и всего за два года унёс больше жизней, чем все сражения этого глобального конфликта.
Пик болезни человека
counts = df_clean['century'].value_counts () Частотный анализ
Из-за огромной разницы в численности населения в разные эпохи на диаграмме видно, что пик распространения болезней приходится на период, приближенный к 21 веку. Это наблюдение иллюстрирует два ключевых фактора: демографический рост и эволюция учёта.Таким образом, диаграмма отражает не столько истинную историческую частоту эпидемий, сколько совокупность демографических и эпидемиологических данных, которые стали возможны благодаря развитию общества, технологий и медицины
x = np.arange (len (decades)) z = np.polyfit (x, decades.values, 2) Полиномиальная регрессия 2-й степени
p = np.poly1d (z) Построение тренда
Ещё ближе это можно рассмотреть на диаграмме, где данные представлены в разрезе десятилетий.
Места в которых больше всего вспышек
pivot = df2.pivot_table (index='Disease_Norm', columns='Region_Norm', values='Event', aggfunc='count')
Карта вспышек заболеваний наглядно демонстрирует хронологию и географию распространения эпидемий по всему миру. Карта не просто фиксирует точки вспышек — она визуализирует историю человечества через призму его уязвимости и борьбы с инфекционными угрозами, показывая, как глобализация и технический прогресс меняли правила распространения болезней.
Заключение анализа
В заключение хочу поделиться своим анализом. Исходя из всего вышесказанного, можно сделать вывод о болезнях-рекордсменах, которые веками мучают человечество. Также я добавила данные о современных заболеваниях (COVID-19, ВИЧ/СПИД) для наглядной иллюстрации того, как развитие медицины и изменения в обществе повлияли на смертность от различных болезней.
Для этого сравнения я выбрала четыре исторические болезни, распространённые в эпоху, которая характеризовалась примитивной медициной, постоянными войнами и полной антисанитарией. Именно эти факторы объясняют столь высокую смертность в прошлом по сравнению с нашим временем. В то же время нельзя не отметить возросшие скорость распространения и охват современных заболеваний, что связано с увеличением численности населения и интенсивными мировыми перемещениями.
Использованные инструменты и ресурсы
Для работы воспользовалась каталогом датсетов kaggle и google colab, chatgpt для редакции кода и анализа данных. В работе используются: Круговая диаграмма Столбчатая диаграмма Тепловая карта Радарная диаграмма