
ОПИСАНИЕ ПРОЕКТА
В рамках моего проекта по визуализации данных я решила обратиться к одной из самых значимых тем в истории мировой науки — Нобелевским премиям. Основой для исследования стал датасет Nobel Prize from 1901 to 2020, опубликованный на платформе Kaggle. В нём собрана развернутая информация о лауреатах за весь период существования премии: от года награждения и категории до возраста, университета и страны лауреата. Массив данных открывает широкие возможности для выявления закономерностей и создания информативных визуализаций.
Меня особенно заинтересовало, как менялась структура лауреатов со временем: увеличивается ли участие женщин, в каких областях наблюдается наибольшее разнообразие, как распределяются награды между университетами и возрастными группами. Эти вопросы стали отправной точкой моего исследования.
Для анализа я выбрала несколько разных типов визуализаций:
1. Линейный график 2. Столбчатая диаграмма 3. Scatterplot с трендом 4. Lollipop chart

Обложка к проекту выполнена с помощью нейросети krea.ai (https://www.krea.ai/app) promt: Create a Nobel prize surrounded by elegant data-visualization aesthetics.

promt: Nobel prize ceremony surrounded by elegant data-visualization aesthetics.
ЦВЕТОВАЯ ПАЛИТРА
Чтобы передать сочетание научной точности и престижной атмосферы Нобелевской премии, я разработала собственную цветовую палитру, отражающую её визуальный характер с современными акцентами.
Вдохновением для палитры стали два основных образа: синие оттенки, ассоциирующиеся с официальным стилем и церемониальной эстетикой премии, и яркие зелёные тона, символизирующие науку, исследования и инновации.
Для удобства работы с оттенками я создала палитру в Adobe Color (https://color.adobe.com/ru/), после чего структурировала её в формате, оптимальном для использования в графике и инфографике.

Для всего текста я использовала шрифт Manrope.
Получились такие цвета: #ACEC00 #00182E #013FF6 #000000
цветовая палитра
ГРАФИК 1
На первом этапе анализа мне было важно проследить, как со временем менялось участие мужчин и женщин среди лауреатов Нобелевской премии. Для этого я сопоставила количество награждённых в каждом десятилетии, что позволило увидеть общие тенденции и динамику роста.
Как менялось количество лауреатов по десятилетиям среди мужчин и женщин


код
ГРАФИК 2
Следующим шагом стало сравнение распределения Нобелевских лауреатов по различным категориям. Анализ показывает, какие области науки исторически получили наибольшее количество наград. Дополнительно я проанализировала долю женщин в каждой категории. Этот показатель помогает заметить существенные различия между дисциплинами и понять, где участие женщин наиболее выражено, а где по-прежнему остаётся минимальным.
В каких сферах больше всего нобелевских лауреатов?


код
ГРАФИК 3
Чтобы глубже понять, как менялись карьерные траектории нобелевских лауреатов, я проанализировала возраст, в котором они получали премию на протяжении более чем ста лет. Точечное распределение демонстрирует широкую вариативность, однако общий тренд показывает постепенное повышение среднего возраста награждённых.
Как менялся возраст лауреатов с 1900 года


код
ГРАФИК 4
В заключении, чтобы понять, какие академические центры оказывают наибольшее влияние на мировую науку и культуру, я рассмотрела университеты с самым высоким числом Нобелевских лауреатов. Этот рейтинг показывает роль институтов, формирующих целые научные школы. Сравнение лидеров позволяет выявить центры, где сосредоточена значительная часть мировой интеллектуальной активности.
Где же нужно учиться, чтобы получить Нобелевскую премию?


код
ЗАКЛЮЧЕНИЕ
Проведённый обзор Нобелевских премий в динамике показал несколько ключевых тенденций. Во-первых, распределение лауреатов по десятилетиям демонстрирует постепенное расширение участия разных групп исследователей, а также общее увеличение числа награждённых. Несмотря на долгий период явного дисбаланса, доля женщин начала заметно расти лишь во второй половине XX века, что особенно выражено в таких областях, как литература и миротворческая деятельность.
Сравнение разных категорий премий подтверждает: хотя женщины по-прежнему составляют меньшинство среди лауреатов, их вклад постепенно становится более видимым.
Анализ возраста награждённых показывает, что с течением времени лауреаты получают премию всё позже, что подчёркивает рост сложности научных исследований и накопительного характера достижений. Параллельно рассмотрение академических учреждений, давших миру наибольшее число лауреатов, демонстрирует концентрацию научных центров влияния в ведущих университетах США и Великобритании.
Подводя итоги, становится понятно, что Нобелевская премия продолжает оставаться индикатором глобальных научных и культурных тенденций, отражая как накопление знаний и развитие технологий, так и постепенное расширение участия тех групп, чей вклад и присутствие в прошлом были менее заметны.
ИСПОЛЬЗОВАННЫЕ СТАТИСТИЧЕСКИЕ МЕТОДЫ
В ходе анализа данных были применены методы описательной и разведочной статистики:
Описательная статистика — использовалась для агрегирования количества Нобелевских лауреатов по десятилетиям и полу. Это позволило количественно оценить динамику представительства мужчин, женщин и других гендерных групп во времени.
Анализ временных паттернов — реализован с помощью линейных графиков, отражающих изменение числа лауреатов по десятилетиям. Такой подход позволил выявить долгосрочные тренды и структурные сдвиги в гендерном распределении наград.
Сравнительный анализ групп — применялся для сопоставления категорий Нобелевской премии по общему числу лауреатов и доле женщин. Использование комбинированной визуализации (столбчатая диаграмма + линейный график) позволило одновременно анализировать абсолютные и относительные показатели.
Анализ долей и структурных показателей — использовался при расчёте процентной доли женщин среди лауреатов в каждой категории. Это позволило выявить области с наибольшим и наименьшим уровнем гендерного разнообразия.
Визуальный анализ взаимосвязей — реализован с помощью диаграммы рассеяния, отображающей зависимость возраста лауреатов от года получения премии. Такой подход позволил оценить характер связи между временным фактором и возрастом награждения.
Трендовый анализ — выполнен путём аппроксимации данных линейной регрессионной моделью, что позволило выявить общую тенденцию изменения возраста лауреатов во времени.
Ранжирование и сравнительный анализ категорий — применялся для анализа университетов по количеству лауреатов. Это позволило выделить ведущие образовательные учреждения по вкладу в Нобелевские достижения.
Анализ частотных распределений — реализован через lollipop-диаграмму, которая наглядно отразила различия между университетами и позволила избежать визуальной перегрузки по сравнению с классической столбчатой диаграммой.
ОПИСАНИЕ ПРИМЕНЕНИЯ ГЕНЕРАТИВНОЙ МОДЕЛИ И ВСПОМОГАТЕЛЬНЫХ ИНСТРУМЕНТОВ
1. Kaggle — Платформа была использована для поиска и загрузки датасета.
2. Google Colab — Весь процесс работы: обработка данных и визуализация.
3. ChatGPT — Нейросеть применялась для генерации и оптимизации кода, настройки визуального стиля графиков и корректировки функций анализа.
4. Библиотеки Python pandas — использовалась для загрузки датасета, очистки, преобразования и анализа табличных данных. matplotlib — основной инструмент для построения визуализаций в проекте. numpy — для расчёта трендовых линий и математических операций. collections.Counter — при необходимости подсчёта категориальных значений. re — для обработки строковых данных.
5. Цветовая палитра (Adobe Color)
6. krea.ai — Использовала для генерации обложки и визуала премии.