
Данные
Для анализа я использовала данные о населении стран, полученные с платформы Kaggle. Этот набор данных включает информацию о численности населения по странам, годам, континентам, столицам и другим демографическим показателям.
Важность
Я посчитала что эти данные важны, потому что они позволяют проанализировать, какие страны имеют наибольшее население, как менялась численность населения по континентам с течением времени, а также какие регионы лидируют по темпам роста населения.
Виды графиков
1. Столбчатая диаграмма. Для сравнения численности населения стран или континентов. 2. Линейный график. Для анализа динамики изменения населения по годам. 3. Круговая диаграмма. Для отображения распределения населения по континентам или регионам.
Этапы работы
python Copy import pandas as pd import matplotlib.pyplot as plt import seaborn as sns
Устанавливаем общий стиль для всех графиков
sns.set_style («whitegrid»)
Загрузка данных
df = pd.read_csv ('pop.csv') Для создания идей по визуализации и анализу данных я обратилась к ChatGPT. Вот примеры запросов, которые я использовала: Промт: Какие типы графиков лучше всего подойдут для анализа населения стран? Ответ: Использовать столбчатые диаграммы для сравнения численности населения по странам, линейные графики для анализа динамики изменения населения по годам и круговые диаграммы для отображения распределения населения по континентам.
1. Столбчатая диаграмма: Топ-10 стран по населению в 2022 году
plt.figure (figsize=(12, 6)) top_10_population = df.nlargest (10, '2022 Population') sns.barplot (x='Country/Territory', y='2022 Population', data=top_10_population, palette='viridis') plt.title ('Топ-10 стран по населению в 2022 году') plt.xlabel ('Страна') plt.ylabel ('Население (2022)') plt.xticks (rotation=45) plt.show ()
2. Линейный график: Динамика населения Европы и Азии с 1970 по 2022 год
Европы и Азии с 1970 по 2022 год
europe_data = df[df['Continent'] == 'Europe'] asia_data = df[df['Continent'] == 'Asia']
years = ['1970 Population', '1980 Population', '1990 Population', '2000 Population', '2010 Population', '2015 Population', '2020 Population', '2022 Population'] europe_population = europe_data[years].sum () asia_population = asia_data[years].sum ()
plt.figure (figsize=(10, 6)) plt.plot (years, europe_population, marker='o', label='Европа', color='blue') plt.plot (years, asia_population, marker='o', label='Азия', color='green') plt.title ('Динамика населения Европы и Азии (1970–2022)') plt.xlabel ('Год') plt.ylabel ('Население') plt.xticks (rotation=45) plt.legend () plt.grid (True) plt.show ()
3. Линейный график: Динамика населения России с 1970 по 2022 год
russia_data = df[df['Country/Territory'] == 'Russia'] population = russia_data[years].values.flatten ()
plt.figure (figsize=(10, 6)) plt.plot (years, population, marker='o', color='red') plt.title ('Динамика населения России (1970–2022)') plt.xlabel ('Год') plt.ylabel ('Население') plt.xticks (rotation=45) plt.grid (True) plt.show ()
4. Круговая диаграмма: Распределение населения по континентам в 2022 году
continent_population = df.groupby ('Continent')['2022 Population'].sum ()
plt.figure (figsize=(8, 8)) plt.pie (continent_population, labels=continent_population.index, autopct='%1.1f%%', startangle=140, colors=sns.color_palette ('pastel')) plt.title ('Распределение населения по континентам (2022)') plt.show ()
Ссылка на Google Сolab