
Описание датасета
В рамках данного проекта был использован датасет synthetic_disaster_events_2025.csv, содержащий информацию о чрезвычайных и катастрофических событиях. Данные включают тип чрезвычайного события, географическое расположение, дату возникновения, уровень серьёзности (severity level), численность пострадавшего населения, оценку экономического ущерба, время реагирования, а также бинарный признак отнесения события к категории крупных катастроф (major disaster).
После базовой очистки данных датасет подходит для проведения разведочного анализа и визуализации ключевых характеристик рисков.
Цель исследования
Целью исследования является анализ структуры и масштабов чрезвычайных событий, выявление наиболее распространённых типов катастроф, оценка их человеческого и экономического воздействия, а также анализ динамики событий во времени.
Графики

График № 1. Распределение событий по типам катастроф

Столбчатая диаграмма отражает количество чрезвычайных событий по различным типам катастроф. Видно, что отдельные категории встречаются значительно чаще других, что позволяет выделить наиболее распространённые типы рисков и определить приоритетные направления для мониторинга и профилактики.

График № 2. Топ-10 локаций по числу чрезвычайных событий

График демонстрирует десять локаций с наибольшим количеством зафиксированных событий. Высокая концентрация катастроф в отдельных регионах может указывать как на повышенную уязвимость территорий, так и на более развитые системы регистрации и мониторинга событий.
График № 3. Экономический ущерб в зависимости от типа катастрофы

Boxplot показывает распределение экономических потерь по типам чрезвычайных событий (используется логарифмическое преобразование для повышения читаемости). Видно, что не только средние значения, но и разброс ущерба существенно различаются между типами катастроф, что отражает неоднородность их последствий.
График № 4. Связь уровня серьёзности и численности пострадавших

Точечная диаграмма иллюстрирует взаимосвязь между уровнем серьёзности события и численностью затронутого населения. В целом прослеживается положительная зависимость: более серьёзные катастрофы, как правило, затрагивают большее количество людей, однако наблюдается значительный разброс значений.
График № 5. Динамика чрезвычайных событий во времени

Линейный график отображает количество событий по месяцам. Анализ временной динамики позволяет выявить возможные сезонные колебания и периоды повышенной активности чрезвычайных ситуаций.
График № 6. Человеческий и экономический ущерб с учётом масштаба катастрофы

На данном графике показана зависимость между численностью пострадавшего населения и экономическим ущербом с выделением крупных катастроф (major disasters). Крупные события, как правило, характеризуются более высокими значениями как по человеческим, так и по экономическим потерям, однако пересечения групп подчёркивают сложность классификации катастроф исключительно по одному показателю.
Заключение
В ходе анализа были выявлены следующие ключевые закономерности:
Визуальный анализ позволил наглядно представить структуру рисков и основные взаимосвязи между характеристиками чрезвычайных событий без использования сложных статистических моделей.
Использование ИИ
В рамках проекта генеративная модель ChatGPT (OpenAI) использовалась в качестве вспомогательного инструмента для:
ИИ не заменял самостоятельный анализ данных и использовался исключительно как поддерживающий инструмент.
Ссылка на папку с датасетом и кодом: https://disk.yandex.ru/d/em_0-e4-dzti7w