Original size 1750x2480

Визуализация данных о метрополитенах мира

PROTECT STATUS: not protected

О проекте

В данном проекте проведён анализ датасета о метрополитенах мира. Основная цель заключалась в выявлении закономерностей и взаимосвязей между такими показателями, как год открытия метро, протяжённость сети, количество станций, пассажиропоток, а также город, страна и регион расположения метрополитена. Для наглядного представления информации были использованы различные типы визуализаций: круговая и столбчатая диаграммы, линейный график, диаграмма рассеяния и тепловая карта. Выбор графиков определялся характером данных и стремлением наиболее чётко отразить выявленные закономерности.

В исследовании использовались открытые данные с сайта kaggle.ru.

Стилизация графиков выполнена с использованием наиболее характерных цветов линий метро, а также шрифта, применяемого в Московском метрополитене.

big
Original size 1920x767

Визуализация

Сначала я импортировала необходимые библиотеки: pandas, seaborn, matplotlib.pyplot, matplotlib.colors. После чего считала csv-файл датасета.

big
Original size 1920x356

В качестве первой визуализации была выбрана круговая диаграмма. Она отражает процентное распределение количества метрополитенов по различным регионам мира. Из диаграммы видно, что наибольшая доля метрополитенов (почти 60%) приходится на Азию.

big
Original size 1920x724
Original size 1920x1080

Столбчатая диаграмма демонстрирует топ-10 стран с самой протяжённой сетью метрополитенов. С заметным отрывом Китай занимает первое место, на втором месте находится Индия. Остальные страны из десятки лидеров имеют схожие показатели по длине метро.

Original size 1920x770
Original size 1920x1080

Линейная диаграмма иллюстрирует ежегодный рост общего числа станций по всему миру. Особенно заметное увеличение произошло после 1960-х годов

Original size 1920x724
Original size 1920x1080

Диаграмма рассеяния иллюстрирует взаимосвязь между годовым пассажиропотоком метрополитенов и их протяжённостью. Из графика видно, что между этими показателями прослеживается слабая линейная зависимость.

Original size 1920x724
Original size 1920x1080

Тепловая карта отображает пассажиропоток крупнейших систем метро, указывая соответствующие города и страны. Из визуализации видно, что наибольший пассажиропоток зафиксирован в Шанхае.

Original size 1920x1552
Original size 1920x1080

Заключение

Анализ данных о метрополитенах позволил получить сведения о развитии подземного транспорта в разных регионах. Были выявлены лидеры по протяжённости сети, количеству станций и пассажиропотоку — такими оказались страны Азии, особенно Китай, где расположены самые масштабные системы метро. Также были рассмотрены взаимосвязи между несколькими показателями, представленными в датасете.

Использованные ресурсы и описание применения генеративной модели

Kaggle — поиск датасета Qwen — уточнение/исправление ошибок кода Perplexity — уточнение/исправление ошибок кода и редактирование текста исследования

Визуализация данных о метрополитенах мира
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more