
Вводная часть
Для анализа уровня безработицы в России и США в период с 1991 по 2023 год были использованы данные платформы Our World In Data. Представленная выборка позволяет проследить динамику изменений и выявить ключевые тенденции в развитии рынков труда двух стран.
Источник: Our World In Data. Уровень безработицы, выборка по России и США (1991–2023). Доступно по ссылке: https://ourworldindata.org/grapher/unemployment-rate?tab=chart&country=~RUS#sources-and-processing (дата обращения: 19.03.2025).
Как студентка 2 курса Школы дизайна, я рассматриваю уровень безработицы не только как экономический показатель, но и как фактор, влияющий на визуальную культуру, социальные тренды и рынок креативных профессий. Дизайн тесно связан с экономическими процессами: кризисы изменяют запросы общества, влияют на популярность минимализма или, наоборот, ярких, вызывающих визуальных решений.
Изучение безработицы в России и США с 1991 по 2023 год помогает понять, как менялась структура занятости, какие профессии становились востребованными, а какие теряли актуальность. Это особенно важно для будущих дизайнеров, ведь креативные индустрии зависят от состояния экономики, технологических трендов и потребностей рынка.
Линейные графики выбраны для анализа динамики.
Гистограммы и KDE — для изучения распределения.
Диаграмма рассеяния применена некорректно из-за неверного типа данных.
Текстовые средние требуют проверки исходных данных.
Этапы работы
Я взяла табличкe csv формате, импортировала библиотеки для работы с этими данными:
import pandas as pd import matplotlib.pyplot as plt
Далее я выгружаю данные из файла:
file_path = «/mnt/data/unemployment-rate.csv» df = pd.read_csv (file_path)
Далее я переименовываю для более удобного вывода столбцы с данными и сортирую данные по странам и годам, также вычисляю на основе данных средние значения:
df.rename (columns={ «Unemployment, total (% of total labor force) (modeled ILO estimate)»: «Unemployment Rate» }, inplace=True)
df_russia = df[df[«Entity»] == «Russia»] df_usa = df[df[«Entity»] == «United States»]
avg_russia = df_russia[«Unemployment Rate»].mean () avg_usa = df_usa[«Unemployment Rate»].mean ()
avg_russia, avg_usa
Далее отрисовываю графики и добавляю в них свою стилизацию, вывожу в виде изображений:
plt.figure (figsize=(10, 5))
plt.plot (df_russia[«Year»], df_russia[«Unemployment Rate»], color="orange», label="Россия») plt.plot (df_usa[«Year»], df_usa[«Unemployment Rate»], color="purple», label="СШ
Итоговые графики
Линейный график
Описание: График с линиями для России и США, отображающий изменение уровня безработицы по годам (1990–2020). Добавлены горизонтальные пунктирные линии для средних значений.
Причина выбора: Линейные графики идеальны для визуализации временных рядов. Они позволяют отследить динамику, пики и спады безработицы, а также сравнить тренды между странами.
Круговая диаграмма
Описание: Указаны средние значения (Россия — 55%, США — 45%) в виде текста.
Причина выбора: Простое сравнение средних, но данные противоречат CSV-файлу. Вероятно, ошибка ввода или учебный пример.
Диаграмма рассеяния
Описание: Точечный график с годами на оси X и уровнем безработицы на оси Y.
Причина выбора: Диаграмма рассеяния обычно используется для поиска корреляций, но здесь она некорректна, так как время — категориальная переменная. Лучше подошел бы линейный график.
График плотности (KDE)
Описание: Кривые плотности распределения для России и США в диапазоне 0–17.5%.
Причина выбора: KDE показывает форму распределения данных, выделяя зоны концентрации значений. Полезно для сравнения «сглаженных» распределений между странами.
Гистограмма с KDE (Страница 5)
Описание: Гистограмма с наложенными кривыми плотности для России и США.
Причина выбора: Комбинация гистограммы и KDE позволяет одновременно увидеть распределение по интервалам и общую форму данных. Это помогает анализировать частоту и плотность значений.
Гистограмма
Описание: Столбчатая диаграмма с интервалами уровня безработицы (4–12%).
Причина выбора: Гистограмма показывает, как часто безработица попадает в определённые диапазоны. Это упрощает сравнение «типичных» значений для России и США.
Гистограмма распределения безработицы
Вид: Гистограмма с двумя столбцами (Россия и США), отображающая частоту уровней безработицы в диапазоне 4–12%.
Причина выбора: Гистограмма позволяет визуализировать распределение данных, показывая, в каких диапазонах чаще всего встречаются значения безработицы для каждой страны. Это помогает сравнить, в каких периодах страны сталкивались с пиками или спадами.
Блокнот с кодом и датасет: https://disk.yandex.ru/d/p266vq9hTxZtRA
Описание применения генеративной модели
Для генерации обложки: Leonardo.Ai https://app.leonardo.ai/
Prompt: Create a thematic poster showing the suffering of people due to high unemployment, use dark colors, mostly black
Для рекомендации по работе с библиотекой Pandas. ChatGPT https://chatgpt.com/
Prompt: Начало работы с pandas, советы по библиотеке, какие основные функции есть.