
Описание концепции
Данный проект посвящён визуализации данных о миллиардерах и распределении глобального богатства на 2024 год (т.к. это самая ближайшая статистика к настоящему году). Тема проекта актуальна для современного общества, так как рейтинги самых богатых людей регулярно появляются в медиа, но за сухими цифрами редко стоит попытка понять, как именно формируется капитал и какие факторы на это влияют. Было важно посмотреть на миллиардеров не только как на отдельные имена, а как на социально-экономическое явление.

Мудборд. recraft.ai
В качестве основы для исследования был использован открытый датасет (https://www.kaggle.com/datasets/guillemservera/forbes-billionaires-1997-2023) с платформы Kaggle, содержащий данные о крупнейших состояниях мира, отраслях экономики, возрасте миллиардеров, а также происхождении их капитала.
Вопросы для анализа и виды графиков
В процессе работы было сформулировано несколько ключевых вопросов: — какие люди и индустрии сегодня аккумулируют наибольшие объёмы богатства; — насколько распространён «self-made» путь по сравнению с наследством; — существуют ли заметные гендерные различия; — в каком возрасте чаще всего формируются крупнейшие состояния.

Мудборд. recraft.ai
Также, использовалось несколько типов визуализаций, каждая из которых отвечает за отдельный аналитический аспект: 1. Горизонтальная столбчатая диаграмма 2. Lollipop chart 3. Горизонтальная столбчатая диаграмма 4. Диаграмма рассеяния с джиттером
Визуальный стиль
Мудборд. recraft.ai
Визуальный стиль выбран достаточно официальный. В качестве основы взят тёмный фон, и нейтральные по настроению оттенки. Для всего текста и подписей использовался шрифт PT Serif Bold Italic.
Мудборд по цветам. Adobe Color
График 1 Самые богатые люди 2024 года
Первый график показывает топ-15 самых богатых людей мира в 2024 году. Он позволяет быстро сравнить размеры состояний и увидеть, насколько велика разница даже внутри этой узкой группы. График наглядно демонстрирует высокую концентрацию капитала и подчёркивает, что основная часть богатства сосредоточена у нескольких лидеров рейтинга.
График 2 Куда идти, чтобы стать миллиардером?
Второй график отражает распределение миллиардеров по отраслям экономики. Он помогает понять, какие сферы чаще всего становятся источником крупных состояний. Анализ показывает, что финансы и технологии заметно опережают другие индустрии, формируя основную часть миллиардеров мира.
График 3 Происхождение миллиардов
Третий график посвящён происхождению капитала с учётом гендера. Он позволяет сравнить долю «self-made» миллиардеров и тех, кто получил состояние по наследству. Визуализация подчёркивает значительное преобладание «self-made» мужчин и одновременно показывает, что для женщин наследственный капитал играет более заметную роль.
График 4 Средний возраст миллиардеров
Четвёртый график анализирует возраст миллиардеров. Точечное распределение демонстрирует широкий разброс значений, а линия среднего возраста помогает увидеть общую тенденцию. График показывает, что большинство крупных состояний формируются в зрелом возрасте, а ранний успех встречается значительно реже.
Заключение
Крупнейшие состояния сосредоточены у ограниченного круга людей и чаще всего связаны с финансовым сектором и технологиями. «Self-made» путь действительно доминирует, однако наследство остаётся важным фактором, особенно в контексте гендерных различий.
Возрастной анализ показывает, что миллиардеры, как правило, приходят к максимальному капиталу спустя многие годы, что подчёркивает накопительный характер богатства и разрушает миф о быстром успехе.
В целом данный проект показывает, что данные о миллиардерах интересны не только как рейтинги, но и как способ лучше понять структуру современной экономики и социальные различия. Визуализация помогает сделать эти выводы более наглядными и доступными для восприятия.
Использованные статистические методы
В ходе анализа данных были применены методы описательной и разведочной статистики:
Описательная статистика и ранжирование — использовались для анализа распределения капитала среди миллиардеров. Сортировка по величине чистого капитала позволила выделить топ-15 самых богатых людей мира и сравнить абсолютные значения их состояний.
Визуальный сравнительный анализ количественных показателей — реализован с помощью горизонтальной столбчатой диаграммы, что обеспечило наглядное сравнение уровней благосостояния между ведущими представителями списка миллиардеров.
Частотный анализ категориальных данных — применялся для определения индустрий с наибольшим числом миллиардеров. Подсчёт количества наблюдений по бизнес-категориям позволил выявить наиболее «капиталоёмкие» отрасли мировой экономики.
Анализ структуры совокупности — использовался при изучении происхождения капитала миллиардеров («self-made» vs наследство) с дополнительным разбиением по полу. Агрегирование и расчёт долей позволили оценить вклад каждой подгруппы в общую популяцию миллиардеров.
Процентный анализ и декомпозиция долей — реализованы через составную горизонтальную диаграмму, что позволило одновременно отразить различия по источнику капитала и гендерному признаку в рамках одной визуальной модели.
Анализ распределения возрастных характеристик — выполнен для изучения возраста миллиардеров. Преобразование данных и исключение пропусков позволили корректно оценить возрастную структуру выборки.
Оценка центральной тенденции — использовалась для расчёта среднего возраста миллиардеров, который был визуально выделен на графике как ориентир для интерпретации распределения.
Визуальный анализ плотности и разброса наблюдений — реализован с помощью точечной диаграммы с искусственным вертикальным рассеиванием (jitter), что позволило избежать наложения точек и наглядно показать концентрацию возрастных значений.
Описание применения генеративной модели и вспомогательных инструментов
1. Kaggle — Платформа была использована для поиска и загрузки датасета.
2. Google Colab — Весь процесс работы: обработка данных и визуализация.
3. Библиотеки Python kagglehub — для автоматического скачивания датасета. matplotlib.font_manager — для подключения кастомного шрифта. pandas — использовалась для загрузки датасета, очистки, преобразования и анализа табличных данных. matplotlib — основной инструмент для построения визуализаций в проекте. numpy — применялась для работы с числовыми данными и расчёта вспомогательных величин при построении графиков.
4. Цветовая палитра (Adobe Color)
5. ChatGPT — Нейросеть применялась для генерации и оптимизации кода, настройки визуального стиля графиков и корректировки функций анализа.
6. recraft.ai — Использовалась для генерации обложки и мудбордов.
Промпт для обложки: Abstract world map with vintage texture, global finance concept, scattered coins over continents, dotted travel routes and circular paths, muted green and blue tones, top-down view, minimalist infographic style, high detail.
Промпт для мудбордов: billionaires lifestyle.