Original size 1140x1600

Анализ данных и визуализация коэффициента бедности в Азии

PROTECT STATUS: not protected
The project is taking part in the competition

Обоснование выбора темы: Анализ бедности в Азии по данным Всемирного банка

Курс — программирование для креативных индустрий

1. Высокая социально-экономическая и политическая актуальность темы.

Азия — самый густонаселенный и экономически динамичный регион мира, где проживает около 60% мирового населения. Контраст между экономическими «тиграми» (Сингапур, Южная Корея) и странами с высоким уровнем бедности (Афганистан, Йемен) делает его идеальной лабораторией для сравнительного анализа.

2. Огромный потенциал для глубокого и разнообразного анализа данных.

На основе этих данных можно провести многоуровневый анализ, выходящий далеко за рамки простой описательной статистики: пространственный (географический) анализ, сравнительный анализ и исторический.

Результаты такого анализа могут представлять интерес для международных организаций (ООН, МВФ), неправительственных организаций и политиков, разрабатывающих программы социальной поддержки и экономического развития.

3. Беспрецедентное качество и надежность источника данных

Выбор платформы по борьбе с бедностью и неравенством Всемирного банка (PIP) — это выбор золотого стандарта в области глобальной статистики. Всемирный банк является ведущим международным финансовым институтом, чьи данные по бедности считаются официальными и наиболее цитируемыми в академических исследованиях и отчетах ООН. |

Обоснование интереса к анализу данных о бедности в Азии

Я глубоко заинтересована в азиатских культурах, поэтому мне было важно изучить, как они устроены изнутри — не только через призму искусства, философии или традиций, но и через объективные социально-экономические показатели. Выбор данных о бедности в Азии от Всемирного банка для меня стал осознанным мостом между личным увлечением и строгим научным анализом. Мое увлечение культурой всегда было связано с вопросом: «Как живут обычные люди, которые создают и поддерживают эти традиции?». Уровень бедности — это прямой индикатор качества жизни, доступности образования, здравоохранения и социальных лифтов. Анализ этих данных помогает мне глубже понять, как устроены эти страны.

Мною было использовано 4 вида графиков: горизонтальная столбчатая диаграмма, гистограмма с оценкой плотности ядра, диаграмма рассеяния с линией тренда, боксплот с точками данных

Эти графики выбраны, чтобы последовательно ответить на ключевые вопросы анализа: 1. Где ситуация хуже всего? (горизонтальные столбцы), 2. Как в целом распределена бедность? (гистограмма), 3. Есть ли связь между переменными? (диаграмма рассеяния), 4. Каков разброс данных и есть ли аномалии? (боксплот). Вместе они дают полную картину.

Этап 1: Загрузка и диагностика данных

Original size 1920x1080

Этап 2: Создание визуализаций

Original size 1920x1080

Этап 3: Статистический анализ

Original size 1920x1080

В работе мною была задействована нейросеть Deepseek для выявления максимально подходящих к теме и виду данных статистических методов. Я уточнила у нейросети какие виды графиков лучше всего подойдут и в каком порядке мне следует исследовать предоставленную таблицу.

Ключевые статистические методы

1. Описательная статистика — я рассчитала основные показатели: среднее значение (общая картина), медиану (устойчивый к выбросам центр распределения), стандартное отклонение (разброс данных) и процентили (10-й, 25-й, 50-й, 75-й, 90-й) для детального понимания структуры распределения.

2. Корреляционный анализ — с помощью коэффициента корреляции Пирсона я измерила силу и направление линейной связи между двумя ключевыми переменными: порогом дохода (day value) и уровнем бедности (percentage day).

3. Регрессионный анализ — построив линейную регрессионную модель, я смогла не только визуализировать тренд на диаграмме рассеяния, но и получить математическое уравнение, описывающее зависимость между переменными.

4. Анализ распределения — для исследования формы и особенностей распределения данных использовались гистограмма, оценка плотности ядра (KDE) и боксплот (box plot), который наглядно показывает медиану, квартили и выявляет статистические выбросы.

Горизонтальная столбчатая диаграмма

Original size 1867x1317

Гистограмма с оценкой плотности ядра

Original size 2035x1548

Диаграмма рассеяния с линией тренда

Original size 1892x1422

Box Plot

Original size 2053x1454
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more