Original size 1140x1600

Анализ данных о миллиардерах и распределении глобального богатства

PROTECT STATUS: not protected
The project is taking part in the competition

Описание концепции

Данный проект посвящён визуализации данных о миллиардерах и распределении глобального богатства на 2024 год (т.к. это самая ближайшая статистика к настоящему году). Тема проекта актуальна для современного общества, так как рейтинги самых богатых людей регулярно появляются в медиа, но за сухими цифрами редко стоит попытка понять, как именно формируется капитал и какие факторы на это влияют. Было важно посмотреть на миллиардеров не только как на отдельные имена, а как на социально-экономическое явление.

big
Original size 1280x815

Мудборд. recraft.ai

В качестве основы для исследования был использован открытый датасет (https://www.kaggle.com/datasets/guillemservera/forbes-billionaires-1997-2023) с платформы Kaggle, содержащий данные о крупнейших состояниях мира, отраслях экономики, возрасте миллиардеров, а также происхождении их капитала.

Вопросы для анализа и виды графиков

В процессе работы было сформулировано несколько ключевых вопросов: — какие люди и индустрии сегодня аккумулируют наибольшие объёмы богатства; — насколько распространён «self-made» путь по сравнению с наследством; — существуют ли заметные гендерные различия; — в каком возрасте чаще всего формируются крупнейшие состояния.

big
Original size 1280x815

Мудборд. recraft.ai

Также, использовалось несколько типов визуализаций, каждая из которых отвечает за отдельный аналитический аспект: 1. Горизонтальная столбчатая диаграмма 2. Lollipop chart 3. Горизонтальная столбчатая диаграмма 4. Диаграмма рассеяния с джиттером

Визуальный стиль

Original size 1280x815

Мудборд. recraft.ai

Визуальный стиль выбран достаточно официальный. В качестве основы взят тёмный фон, и нейтральные по настроению оттенки. Для всего текста и подписей использовался шрифт PT Serif Bold Italic.

Original size 3149x965

Мудборд по цветам. Adobe Color

График 1 Самые богатые люди 2024 года

Первый график показывает топ-15 самых богатых людей мира в 2024 году. Он позволяет быстро сравнить размеры состояний и увидеть, насколько велика разница даже внутри этой узкой группы. График наглядно демонстрирует высокую концентрацию капитала и подчёркивает, что основная часть богатства сосредоточена у нескольких лидеров рейтинга.

Original size 1280x815
0

График 2 Куда идти, чтобы стать миллиардером?

Второй график отражает распределение миллиардеров по отраслям экономики. Он помогает понять, какие сферы чаще всего становятся источником крупных состояний. Анализ показывает, что финансы и технологии заметно опережают другие индустрии, формируя основную часть миллиардеров мира.

Original size 1280x815
0

График 3 Происхождение миллиардов

Третий график посвящён происхождению капитала с учётом гендера. Он позволяет сравнить долю «self-made» миллиардеров и тех, кто получил состояние по наследству. Визуализация подчёркивает значительное преобладание «self-made» мужчин и одновременно показывает, что для женщин наследственный капитал играет более заметную роль.

Original size 1280x815
0

График 4 Средний возраст миллиардеров

Четвёртый график анализирует возраст миллиардеров. Точечное распределение демонстрирует широкий разброс значений, а линия среднего возраста помогает увидеть общую тенденцию. График показывает, что большинство крупных состояний формируются в зрелом возрасте, а ранний успех встречается значительно реже.

Original size 1280x815
0

Заключение

Крупнейшие состояния сосредоточены у ограниченного круга людей и чаще всего связаны с финансовым сектором и технологиями. «Self-made» путь действительно доминирует, однако наследство остаётся важным фактором, особенно в контексте гендерных различий.

Возрастной анализ показывает, что миллиардеры, как правило, приходят к максимальному капиталу спустя многие годы, что подчёркивает накопительный характер богатства и разрушает миф о быстром успехе.

В целом данный проект показывает, что данные о миллиардерах интересны не только как рейтинги, но и как способ лучше понять структуру современной экономики и социальные различия. Визуализация помогает сделать эти выводы более наглядными и доступными для восприятия.

Использованные статистические методы

В ходе анализа данных были применены методы описательной и разведочной статистики:

Описательная статистика и ранжирование — использовались для анализа распределения капитала среди миллиардеров. Сортировка по величине чистого капитала позволила выделить топ-15 самых богатых людей мира и сравнить абсолютные значения их состояний.

Визуальный сравнительный анализ количественных показателей — реализован с помощью горизонтальной столбчатой диаграммы, что обеспечило наглядное сравнение уровней благосостояния между ведущими представителями списка миллиардеров.

Частотный анализ категориальных данных — применялся для определения индустрий с наибольшим числом миллиардеров. Подсчёт количества наблюдений по бизнес-категориям позволил выявить наиболее «капиталоёмкие» отрасли мировой экономики.

Анализ структуры совокупности — использовался при изучении происхождения капитала миллиардеров («self-made» vs наследство) с дополнительным разбиением по полу. Агрегирование и расчёт долей позволили оценить вклад каждой подгруппы в общую популяцию миллиардеров.

Процентный анализ и декомпозиция долей — реализованы через составную горизонтальную диаграмму, что позволило одновременно отразить различия по источнику капитала и гендерному признаку в рамках одной визуальной модели.

Анализ распределения возрастных характеристик — выполнен для изучения возраста миллиардеров. Преобразование данных и исключение пропусков позволили корректно оценить возрастную структуру выборки.

Оценка центральной тенденции — использовалась для расчёта среднего возраста миллиардеров, который был визуально выделен на графике как ориентир для интерпретации распределения.

Визуальный анализ плотности и разброса наблюдений — реализован с помощью точечной диаграммы с искусственным вертикальным рассеиванием (jitter), что позволило избежать наложения точек и наглядно показать концентрацию возрастных значений.

Описание применения генеративной модели и вспомогательных инструментов

1. Kaggle — Платформа была использована для поиска и загрузки датасета.

2. Google Colab — Весь процесс работы: обработка данных и визуализация.

3. Библиотеки Python kagglehub — для автоматического скачивания датасета. matplotlib.font_manager — для подключения кастомного шрифта. pandas — использовалась для загрузки датасета, очистки, преобразования и анализа табличных данных. matplotlib — основной инструмент для построения визуализаций в проекте. numpy — применялась для работы с числовыми данными и расчёта вспомогательных величин при построении графиков.

4. Цветовая палитра (Adobe Color)

5. ChatGPT — Нейросеть применялась для генерации и оптимизации кода, настройки визуального стиля графиков и корректировки функций анализа.

6. recraft.ai — Использовалась для генерации обложки и мудбордов.

Промпт для обложки: Abstract world map with vintage texture, global finance concept, scattered coins over continents, dotted travel routes and circular paths, muted green and blue tones, top-down view, minimalist infographic style, high detail.

Промпт для мудбордов: billionaires lifestyle.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more