Original size 564x846

Анализ данных и визуализации по теме: «Призеры архитектурных премий»

PROTECT STATUS: not protected
The project is taking part in the competition

Идея

Проект представляет собой анализ и визуализацию данных архитектурных премий.

Для анализа были выбраны данные о победителях международных архитектурных премий: Pritzker Architecture Prize (с 1979 года) Architizer A+ Awards (с 2013 года) Golden Trezzini Awards (с 2018 года)

Источники данных: официальные сайты премий, открытые справочные ресурсы об архитектурных наградах.

Я увлекаюсь современной архитектурой и было интересно проследить за тенденциями — как изменялись роли стран в этой сфере.

Другим людям могут быть интересны эти сведения также, потому что архитектурные премии отражают несколько факторов: - профессиональное признание архитекторов на мировом уровне; - исторические и географические тренды в архитектуре; - культурное влияние и формирование архитектурного канона.

Анализ этих данных позволяет: - проследить географическое распределение победителей; - выявить тенденции и изменения во времени; понять, какие страны и регионы оказывают наибольшее влияние в архитектуре.

Графики

Для визуализации данных были выбраны несколько типов графиков:

1. Столбчатые диаграммы: Для сравнения количества победителей по странам.

2. Линейные графики: Для анализа динамики лауреатов по десятилетиям. Показывают тренды во времени.

3. Круговые диаграммы: Для отображения доли ведущих стран в общем числе победителей.

4. Кумулятивные графики: Для оценки институционального роста премий и накопления лауреатов с течением времени.

Обработка данных

шаг № 1 // Загрузка данных

код: import pandas as pd from google.colab import files

uploaded = files.upload () df = pd.read_csv (list (uploaded.keys ())[0]) df.head ()

шаг № 2 // Проверка структуры данных

df.info () df.describe (include='all')

шаг № 3 // Подготовка дополнительных признаков

Создаем колонку «Decade» для анализа по десятилетиям:

df['Decade'] = (df['Year'] // 10) * 10

шаг № 4 // Подсчет по группам

Подсчет числа победителей по странам:

country_counts = df['Country'].value_counts ()

Подсчет числа победителей по десятилетиям:

decade_counts = df.groupby ('Decade').size ()

Стилизация графиков

Выбран минималистичный и читабельный стиль, чтобы визуализация выглядела как научная инфографика.

Использован seaborn с темой whitegrid для чистоты и контраста.

Палитра цветов — «viridis» и «coolwarm».

Формат визуализации

1. Exploratory (изучающий) подход:

- сравнение стран по количеству лауреатов. - анализ динамики победителей по десятилетиям. - оценка концентрации признания.

2. Explanatory (объясняющий) подход: - выделение лидирующих стран и регионов. - демонстрация роста культурного разнообразия с течением времени. - объяснение институционального развития премий через кумулятивные графики.

Статистические методы

1. Частотный анализ (value_counts) — подсчет победителей по странам.

2. Группировка и агрегация (groupby) — анализ по десятилетиям.

3. Временная агрегация — выявление трендов и изменений во времени.

4. Кумулятивная сумма (cumsum) — изучение накопительного эффекта премий.

5. Визуальный анализ — выявление закономерностей через графики и диаграммы.

Графики

График № 1 // Столбчатая диаграмма: победители по странам

Original size 954x479

country_counts = df['Country'].value_counts ().head (10)

plt.figure (figsize=(10,5)) sns.barplot (x=country_counts.values, y=country_counts.index, palette="viridis») plt.title («Top 10 Countries by Number of Winners») plt.xlabel («Number of Winners») plt.ylabel («Country») plt.show ()

График № 2 // Линейный: количество победителей по десятилетиям

Original size 696x479

df['Decade'] = (df['Year'] // 10) * 10 decade_counts = df.groupby ('Decade').size ()

plt.figure (figsize=(8,5)) sns.lineplot (x=decade_counts.index, y=decade_counts.values, marker='o') plt.title («Winners by Decade») plt.xlabel («Decade») plt.ylabel («Count») plt.show ()

График № 3 // Круговая диаграмма: доля стран

Original size 669x581

plt.figure (figsize=(7,7)) country_counts.plot (kind='pie', autopct='%1.1f%%', cmap='coolwarm') plt.title («Top Country Share of Winners») plt.ylabel (»») plt.show ()

График № 4 // Кумулятивный график победителей

Original size 696x479

cumulative = df.sort_values ('Year').groupby ('Year').size ().cumsum ()

plt.figure (figsize=(8,5)) sns.lineplot (x=cumulative.index, y=cumulative.values) plt.title («Cumulative Number of Winners Over Time») plt.xlabel («Year») plt.ylabel («Cumulative Winners») plt.show ()

Исходная таблица данных и блокнот в Google Colab

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more