Original size 1140x1600

Анализ демографии при помощи Pandas

PROTECT STATUS: not protected

Введение

Для анализа данных была выбрана ожидаемая продолжительность жизни при рождении, начиная с 2020 по 2035 года.

Данные были найдены на сайте «hubofdata.ru»

Была выбрана именно эта тема, поскольку продолжительность жизни является постоянно варьирующимся числом. Из-за этого интересно узнать: сколько проживет нынешнее поколение по прогнозам.

Виды графиков

Линейный график использован для визуализации изменений ожидаемой продолжительности жизни по годам. Это легкий способ показать изменения по времени, что особенно важно для временных данных.

big
Original size 1200x600

Гистограмма построена для анализа различий между мужчинами и женщинами. Это позволяет увидеть величину этих различий.

big
Original size 1200x600

Диаграмма рассеяния использована для анализа корреляции между сценариями. В нашем случае низкий против высокого, чтобы исследовать различия между ними.

Original size 1439x800

Комбинированный график добавлен для сравнения средней продолжительности жизни между мужчинами, женщинами и обоими полами в одном сценарии. Такой подход упрощает сравнение категорий.

Original size 1200x600

Эти виды графиков обеспечивают баланс между простотой восприятия данных и их глубиной анализа. Линейные графики хорошо показывают тренды, а гистограммы и диаграммы рассеяния предоставляют дополнительное понимание различий и взаимосвязей.

Написание кода и стилизация

Для начала я подключил все нужные библиотеки и подсоединил таблицу к коду в Visual Studio.

Original size 567x163

После этого была произведена очистка данных, переименовывание столбцов, а также выделение нужных для создания графиков.

Также было создано сравнение при помощи разницы между столбцами с данными.

Original size 702x266

Сильного упора в стилизацию не происходило. Я постарался оставить данные чистыми и понятными.

Original size 806x231

Единственное, где были изменения это график рассеяния. Была выбрана другая палитра для создания градиента, который позволяет наглядно видеть изменения.

Original size 644x256

Использование нейросетей и файлы

Для создания данной работы была использована нейросеть Kandinsky, для создания обложки.

Original size 445x612

Файлы:

https://drive.google.com/file/d/1aC_iOjXFX8WKA_PU1ZiPIpr_r1ocQ04b/view?usp=sharing

Внутри архива находится файл Python и таблица, по которой велся анализ.

Анализ демографии при помощи Pandas
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more