
Проект был начат 8 марта, и именно День солидарности в борьбе за права женщин вдохновил его тему.

В качестве данных для анализа был взят датасет с сайта Kaggle с информацией об индексе гендерного неравенства в разных странах с 1990 по 2021 год.
В проекте используются разные виды графиков, что позволяет представить информацию наилучшим образом. Линейные графики отражают динамику показателя, точечная диаграмма — пиковые состояния, а гистограммы позволяют наглядно сравнивать значения.
Ход работы
В первую очередь, для анализа данных csv формата нужно открыть табличный файл в Google Colab и импортировать необходимые библиотеки:


Первый график (столбчатая диаграмма) позволяет сравнить индексы Человеческого развития и Гендерного неравенства на разных континентах
Так как таблица содержит не только значение индекса по годам, но и колонки с другой информацией, для построения графиков 2-4 нужно было очистить датафрэйм от лишней информации.
Для удобства и компактности отображения названия колонок в формате «Gender Inequality Index (год)» были сокращены до просто числового значения.
Для второго графика использовались функции группировки по заданному параметру и нахождения среднего значения:
Второй график (линейная диаграмма) показывает динамику индекса неравенства по континентам, а также позволяет сравнить ее с общемировой тенденцией
При составлении графиков я пользовалась чатом GPT, в частности, чтобы найти способы визуализации данных.
Так, для третьего графика применяется карта градиента, которая задает определенный цвет для каждой страны в зависимости от того, насколько высокий в ней индекс неравенства.
Третий график является продолжением второго и позволяет рассмотреть динамику более подробно, по каждой отдельной стране
В следующем графике для каждой страны находится год с наивысшим значением индекса неравенства. Для осуществления этой задачи потребовалось написать функцию, находящую максимальное значение среди всех колонок для одного ряда (страны) датасета:
Четвертый график (точечная диаграмма) позволяет увидеть, в каком году показатель неравенства был наихудшим для каждой страны
Для пятого графика достаточно просто найти разницу между показателем индекса за 1990 и 2021 года и исключить из финальной инфографики страны с отсутствующим значением.
Пятый график (гистограмма) показывает прогресс в гендерном равенстве с 1990 по 2021 год для каждой страны
В финальном графике страны сортируются по уровню равноправия. Отдельная цветовая палитра используется, чтобы показать принадлежность страны к одной из 4 групп человеческого развития.
Шестой график (гистограмма) показывает корреляцию между уровнем равноправия и группой уровня человеческого развития, к которой относится страна
Полученные графики анализируют датасет с разных сторон. По окончании проекта я сделала несколько выводов о неравенстве в мире: 1. В целом уровень гендерного равенства коррелирует с уровнем человеческого развития, однако отдельные страны могут представлять исключение (гр. 1 и 6) 2. Индекс неравенства в разных частях света сопоставим с общемировым уровнем, серьезно отличаются только европейский и африканский континенты (гр. 2) 3. Общая тенденция для индекса гендерного неравенства — нисходящая (гр. 3 и 4) 4. Наибольшего прогресса в борьбе с неравенством добились страны, относящиеся в 1990 году к малоразвитым. Это произошло благодаря общему социально-экономическому подъему, т. к. сейчас они принадлежат к группам с наивысшим уровнем человеческого развития (гр. 5 и 6)
Гугл-диск с датасетом и блокнотом в гугл-коллаб: https://drive.google.com/drive/folders/1-Glr7u-NWeXZECNFZqWO2T2LDnrsXmyc?usp=sharing