
Идея
Проект представляет собой анализ и визуализацию данных архитектурных премий.
Для анализа были выбраны данные о победителях международных архитектурных премий: Pritzker Architecture Prize (с 1979 года) Architizer A+ Awards (с 2013 года) Golden Trezzini Awards (с 2018 года)
Источники данных: официальные сайты премий, открытые справочные ресурсы об архитектурных наградах.
Я увлекаюсь современной архитектурой и было интересно проследить за тенденциями — как изменялись роли стран в этой сфере.
Другим людям могут быть интересны эти сведения также, потому что архитектурные премии отражают несколько факторов: - профессиональное признание архитекторов на мировом уровне; - исторические и географические тренды в архитектуре; - культурное влияние и формирование архитектурного канона.
Анализ этих данных позволяет: - проследить географическое распределение победителей; - выявить тенденции и изменения во времени; понять, какие страны и регионы оказывают наибольшее влияние в архитектуре.
Графики
Для визуализации данных были выбраны несколько типов графиков:
1. Столбчатые диаграммы: Для сравнения количества победителей по странам.
2. Линейные графики: Для анализа динамики лауреатов по десятилетиям. Показывают тренды во времени.
3. Круговые диаграммы: Для отображения доли ведущих стран в общем числе победителей.
4. Кумулятивные графики: Для оценки институционального роста премий и накопления лауреатов с течением времени.
Обработка данных
шаг № 1 // Загрузка данных
код: import pandas as pd from google.colab import files
uploaded = files.upload () df = pd.read_csv (list (uploaded.keys ())[0]) df.head ()
шаг № 2 // Проверка структуры данных
df.info () df.describe (include='all')
шаг № 3 // Подготовка дополнительных признаков
Создаем колонку «Decade» для анализа по десятилетиям:
df['Decade'] = (df['Year'] // 10) * 10
шаг № 4 // Подсчет по группам
Подсчет числа победителей по странам:
country_counts = df['Country'].value_counts ()
Подсчет числа победителей по десятилетиям:
decade_counts = df.groupby ('Decade').size ()
Стилизация графиков
Выбран минималистичный и читабельный стиль, чтобы визуализация выглядела как научная инфографика.
Использован seaborn с темой whitegrid для чистоты и контраста.
Палитра цветов — «viridis» и «coolwarm».
Формат визуализации
1. Exploratory (изучающий) подход:
- сравнение стран по количеству лауреатов. - анализ динамики победителей по десятилетиям. - оценка концентрации признания.
2. Explanatory (объясняющий) подход: - выделение лидирующих стран и регионов. - демонстрация роста культурного разнообразия с течением времени. - объяснение институционального развития премий через кумулятивные графики.
Статистические методы
1. Частотный анализ (value_counts) — подсчет победителей по странам.
2. Группировка и агрегация (groupby) — анализ по десятилетиям.
3. Временная агрегация — выявление трендов и изменений во времени.
4. Кумулятивная сумма (cumsum) — изучение накопительного эффекта премий.
5. Визуальный анализ — выявление закономерностей через графики и диаграммы.
Графики
График № 1 // Столбчатая диаграмма: победители по странам
country_counts = df['Country'].value_counts ().head (10)
plt.figure (figsize=(10,5)) sns.barplot (x=country_counts.values, y=country_counts.index, palette="viridis») plt.title («Top 10 Countries by Number of Winners») plt.xlabel («Number of Winners») plt.ylabel («Country») plt.show ()
График № 2 // Линейный: количество победителей по десятилетиям
df['Decade'] = (df['Year'] // 10) * 10 decade_counts = df.groupby ('Decade').size ()
plt.figure (figsize=(8,5)) sns.lineplot (x=decade_counts.index, y=decade_counts.values, marker='o') plt.title («Winners by Decade») plt.xlabel («Decade») plt.ylabel («Count») plt.show ()
График № 3 // Круговая диаграмма: доля стран
plt.figure (figsize=(7,7)) country_counts.plot (kind='pie', autopct='%1.1f%%', cmap='coolwarm') plt.title («Top Country Share of Winners») plt.ylabel (»») plt.show ()
График № 4 // Кумулятивный график победителей
cumulative = df.sort_values ('Year').groupby ('Year').size ().cumsum ()
plt.figure (figsize=(8,5)) sns.lineplot (x=cumulative.index, y=cumulative.values) plt.title («Cumulative Number of Winners Over Time») plt.xlabel («Year») plt.ylabel («Cumulative Winners») plt.show ()
Исходная таблица данных и блокнот в Google Colab