
Вводная часть
Для анализа я выбрала датасет «Missing people in Russia» с платформы Kaggle. Он представляет собой официальный набор данных МВД РФ о пропавших и разыскиваемых людях, а также об идентифицированных и неидентифицированных телах. В таблице содержатся такие параметры, как пол, возраст, регион, дата исчезновения и статус розыска. Эта тема показалась мне значимой по двум причинам. Во‑первых, речь идёт о людях, которые буквально «исчезли» из статистики и новостей, и визуализация помогает увидеть масштаб проблемы, который обычно остаётся незаметным. Во‑вторых, данные позволяют задать конкретные вопросы: в каких регионах чаще всего пропадают люди, кто исчезает чаще — мужчины или женщины, какие возрастные группы наиболее уязвимы. Датасет хорошо подходит для построения инфографики, потому что сочетает категориальные признаки (пол, регион, статус) и числовые/временные (возраст, даты). Это даёт возможность показать структуру и динамику исчезновений, а не только общие суммы. В работе я анализирую данные за 2019–2021 года, так как это наиболее свежий полный год в доступном датасете.
В ходе анализа я буду использовать несколько типов визуализаций: 1. Столбчатая диаграмма (сравнение числа пропавших людей по регионам России). 2. Линейный график (изменение количества исчезнувших по годам или месяцам). 3. Круговая диаграмма (показатели розыска пропавших людей). 4. Тепловая карта (соотношение пропавших и регионов).
Цветовая палитра

Визуальная метафора строится на контрасте тёмного фона и красных акцентов: графики выглядят как ночное пространство, где вспышки красного показывают зоны угрозы и напряжения. Красный выбран осознанно как цвет опасности и тревоги, поэтому именно им выделяются ключевые показатели, связанные с пропажами, а нейтральные серые и белый остаются фоном и не отвлекают от главного сигнала.
#C0392B, #7B241C, #D5D8DC, #2C3E50
Столбчатая диаграмма
Линейный график
Линейный график показывает не реальное количество пропавших людей, а суммарное значение статистического показателя value во всех строках официальных таблиц за каждый год, куда входят зарегистрированные заявления, случаи розыска, установления личности и другие связанные операции. Поэтому значения на графике, включая заметно низкий уровень в 2021 году, отражают особенности отчётности и объёма внесённых записей (например, изменение структуры таблиц, критериев учёта или неполные данные за год), а не фактическое число людей, которые пропали в эти годы.
Круговая диаграмма
Круговая диаграмма показывает, как между собой распределяются разные типы статистических показателей, связанных с розыском пропавших людей, в данных за 2021 год. Каждый сектор отражает долю суммарного значения соответствующего индикатора (например, зарегистрированные заявления, розыск, установление личности) в общей статистике за год, поэтому диаграмма помогает увидеть, какие категории вносят наибольший вклад в объём отчётных данных.
Тепловая карта
Тепловая карта показывает, как меняются суммарные значения показателя по пропавшим людям для топ‑10 регионов в разные годы, причём каждый цветной прямоугольник — это пара «регион × год». Чем интенсивнее красный цвет ячейки, тем больше суммарное значение показателя в этом регионе в данный год, поэтому по градиенту оттенков можно быстро увидеть, какие регионы стабильно остаются «горячими» по статистике, а где значения ниже или снижаются со временем.
Выводы
1. Анализ показал, что в разных регионах России статистика по пропавшим людям сильно отличается: есть округа и Москва, где суммарные значения показателей заметно выше среднего по стране. 2. В динамике за 2019–2021 годы по отчётным данным наблюдается спад суммарных значений показателя, однако эти графики отражают скорее изменения в структуре и полноте отчётности, чем реальное снижение числа пропавших людей. 3. Распределение по типам показателей показывает, что наибольший вклад дают категории, связанные с регистрацией заявлений и розыском, что подчёркивает нагрузку на системы поиска и учёта.
Блокнот и датасет