Original size 746x1024

История болезни в коде

PROTECT STATUS: not protected
The project is taking part in the competition
big
Original size 1042x271

Введение

На протяжении всей своей истории человечество сопровождали смертоносные эпидемии, уносившие миллионы жизней. Такие события служат мощнейшим катализатором перемен, показывая, насколько уязвимы люди и человечество в целом, но одновременно меняя экономику, ускоряя научный и социальный прогресс. Часто об эпидемиях говорят эмоционально, но как эти трагедии выглядят в цифрах? Как менялась летальность болезней? В этой работе я попыталась это выяснить. Мой выбор пал на данную тему, потому что это социально-глобальная и вечно актуальная проблема, которой необходимо придать огласку.

big
Original size 1042x271

Мудборд

Работа с кодом

Чтобы ответить на эти вопросы, напишу код для работы с датасетами. В первую очередь я загрузила и отчистила файлы для дальней работы.

import pandas as pd import numpy as np import re import matplotlib.pyplot as plt

df1 = pd.read_csv («df_1.csv») df2 = pd.read_csv («df_2.csv»)

Самая высокая смертность

0

Круговая диаграмма

Статистика: сортировка, ранжирование, процентное распределение
top10 = df1.sort_values ('deaths', ascending=False).head (10) Ранжирование

pcts = (top10['deaths']/top10['deaths'].sum ()*100).round (1) Процентное распределение

В итоге у меня получился список десяти самых смертоносных болезней в истории. Безусловно, первое и третье места занимают чума в разных своих поколениях — Юстинианова чума и Чёрная смерть. Это, пожалуй, самая опустошительная болезнь за всю историю человечества, выкосившая в своей самой мощной волне до половины населения Европы.

На втором месте находится испанский грипп. Он обрушился на мир, уже истощённый Первой мировой войной, и всего за два года унёс больше жизней, чем все сражения этого глобального конфликта.

Пик болезни человека

0

Эпидемия по векам

Статистика: частотное распределение, агрегация

counts = df_clean['century'].value_counts () Частотный анализ

Из-за огромной разницы в численности населения в разные эпохи на диаграмме видно, что пик распространения болезней приходится на период, приближенный к 21 веку. Это наблюдение иллюстрирует два ключевых фактора: демографический рост и эволюция учёта.Таким образом, диаграмма отражает не столько истинную историческую частоту эпидемий, сколько совокупность демографических и эпидемиологических данных, которые стали возможны благодаря развитию общества, технологий и медицины

0

Эпидемия по десятилетиям

Статистика: времянной ряд, полиомиальный тренд

x = np.arange (len (decades)) z = np.polyfit (x, decades.values, 2) Полиномиальная регрессия 2-й степени

p = np.poly1d (z) Построение тренда

Ещё ближе это можно рассмотреть на диаграмме, где данные представлены в разрезе десятилетий.

Места в которых больше всего вспышек

0

Тепловая карта

Статистика: Свободная таблица, кросстабуляция.

pivot = df2.pivot_table (index='Disease_Norm', columns='Region_Norm', values='Event', aggfunc='count')

Карта вспышек заболеваний наглядно демонстрирует хронологию и географию распространения эпидемий по всему миру. Карта не просто фиксирует точки вспышек — она визуализирует историю человечества через призму его уязвимости и борьбы с инфекционными угрозами, показывая, как глобализация и технический прогресс меняли правила распространения болезней.

Заключение анализа

0

Радарная диаграмма

Статистика: многомерное сравнение, нормализация шкалы (1-10) Каждая эпидемия оценивается по 5 параметрам на единой шкале 1-10. Позволяет сравнивать многомерные профили заболеваний.

В заключение хочу поделиться своим анализом. Исходя из всего вышесказанного, можно сделать вывод о болезнях-рекордсменах, которые веками мучают человечество. Также я добавила данные о современных заболеваниях (COVID-19, ВИЧ/СПИД) для наглядной иллюстрации того, как развитие медицины и изменения в обществе повлияли на смертность от различных болезней.

Для этого сравнения я выбрала четыре исторические болезни, распространённые в эпоху, которая характеризовалась примитивной медициной, постоянными войнами и полной антисанитарией. Именно эти факторы объясняют столь высокую смертность в прошлом по сравнению с нашим временем. В то же время нельзя не отметить возросшие скорость распространения и охват современных заболеваний, что связано с увеличением численности населения и интенсивными мировыми перемещениями.

Использованные инструменты и ресурсы

Для работы воспользовалась каталогом датсетов kaggle и google colab, chatgpt для редакции кода и анализа данных. В работе используются: Круговая диаграмма Столбчатая диаграмма Тепловая карта Радарная диаграмма

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more