Original size 720x1016

Демографические тренды: изменение населения мира по данным Kaggle

PROTECT STATUS: not protected
5

Данные

Для анализа я использовала данные о населении стран, полученные с платформы Kaggle. Этот набор данных включает информацию о численности населения по странам, годам, континентам, столицам и другим демографическим показателям.

Важность

Я посчитала что эти данные важны, потому что они позволяют проанализировать, какие страны имеют наибольшее население, как менялась численность населения по континентам с течением времени, а также какие регионы лидируют по темпам роста населения.

Виды графиков

1. Столбчатая диаграмма. Для сравнения численности населения стран или континентов. 2. Линейный график. Для анализа динамики изменения населения по годам. 3. Круговая диаграмма. Для отображения распределения населения по континентам или регионам.

Этапы работы

python Copy import pandas as pd import matplotlib.pyplot as plt import seaborn as sns

Устанавливаем общий стиль для всех графиков

sns.set_style («whitegrid»)

Загрузка данных

df = pd.read_csv ('pop.csv') Для создания идей по визуализации и анализу данных я обратилась к ChatGPT. Вот примеры запросов, которые я использовала: Промт: Какие типы графиков лучше всего подойдут для анализа населения стран? Ответ: Использовать столбчатые диаграммы для сравнения численности населения по странам, линейные графики для анализа динамики изменения населения по годам и круговые диаграммы для отображения распределения населения по континентам.

1. Столбчатая диаграмма: Топ-10 стран по населению в 2022 году

plt.figure (figsize=(12, 6)) top_10_population = df.nlargest (10, '2022 Population') sns.barplot (x='Country/Territory', y='2022 Population', data=top_10_population, palette='viridis') plt.title ('Топ-10 стран по населению в 2022 году') plt.xlabel ('Страна') plt.ylabel ('Население (2022)') plt.xticks (rotation=45) plt.show ()

Original size 1200x600

2. Линейный график: Динамика населения Европы и Азии с 1970 по 2022 год

Европы и Азии с 1970 по 2022 год

Фильтрация данных по континентам

europe_data = df[df['Continent'] == 'Europe'] asia_data = df[df['Continent'] == 'Asia']

Подготовка данных для графика

years = ['1970 Population', '1980 Population', '1990 Population', '2000 Population', '2010 Population', '2015 Population', '2020 Population', '2022 Population'] europe_population = europe_data[years].sum () asia_population = asia_data[years].sum ()

Линейный график

plt.figure (figsize=(10, 6)) plt.plot (years, europe_population, marker='o', label='Европа', color='blue') plt.plot (years, asia_population, marker='o', label='Азия', color='green') plt.title ('Динамика населения Европы и Азии (1970–2022)') plt.xlabel ('Год') plt.ylabel ('Население') plt.xticks (rotation=45) plt.legend () plt.grid (True) plt.show ()

Original size 1000x600

3. Линейный график: Динамика населения России с 1970 по 2022 год

russia_data = df[df['Country/Territory'] == 'Russia'] population = russia_data[years].values.flatten ()

plt.figure (figsize=(10, 6)) plt.plot (years, population, marker='o', color='red') plt.title ('Динамика населения России (1970–2022)') plt.xlabel ('Год') plt.ylabel ('Население') plt.xticks (rotation=45) plt.grid (True) plt.show ()

Original size 1000x600

4. Круговая диаграмма: Распределение населения по континентам в 2022 году

continent_population = df.groupby ('Continent')['2022 Population'].sum ()

plt.figure (figsize=(8, 8)) plt.pie (continent_population, labels=continent_population.index, autopct='%1.1f%%', startangle=140, colors=sns.color_palette ('pastel')) plt.title ('Распределение населения по континентам (2022)') plt.show ()

Original size 800x800
Original size 2324x728

Ссылка на Google Сolab

Демографические тренды: изменение населения мира по данным Kaggle
5
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more