Original size 1140x1600

Анализ московского метро

PROTECT STATUS: not protected
10

Концепция

Московское метро представляет собой одну из самых больших и активно используемых транспортных сетей на планете, оказывая значительное влияние на повседневную жизнь множества людей. Анализ информации о станциях и количестве пассажиров дает возможность лучше осознать, как распределяются нагрузки в системе метрополитена, а также выявить основные направления и тенденции.

big
Original size 3790x1500

В исследовании были задействованы сведения, полученные с портала открытых данных Правительства Москвы. Проект опирается на два набора данных, в которых содержится информация о станциях метро столицы, их расположении в рамках линий, районов и округов города, а также данные о количестве пассажиров, которые заходят и выходят на каждой станции в различные годы и кварталы. Эти сведения позволяют изучить динамику пассажиропотока на протяжении времени и выявить наиболее загруженные и развитые линии.

Для проведения анализа использовались такие параметры, как название станции, линия, год, квартал, количество вошедших и вышедших пассажиров, район, округ и статус станции.

Были подобраны такие типы диаграмм:

(01) круговая диаграмма (02) столбчатая диаграмма (03) точечная диаграмма (04) тепловая карта

big
Original size 3500x1600

Вдохновением для меня стали архивные фотографии метро, сделанные в период его становления. Это помогло провести параллели между прошлым и настоящим, особенно в контексте того, что многие станции, построенные в те годы, до сих пор остаются важными элементами транспортной сети.

Original size 3790x900

Мудборд

Обработка данных

В начале я импортировала необходимые мне библиотеки: pandas, matplotlib.pyplot, seaborn и matplotlib.colors. После чего добавила в Google Colab файл со шрифтом и добавила его в конфигурацию pyplot.

Original size 3790x1500

Далее я добавила 2 csv файла с датасетами. В одном находится информация о станциях (на какой ветке, в каком городском округе, в каком районе и какой у неё статус). Во втором — о пассажиропотоке (на станции, ветке в определенном году и квартале, а также сколько человек вошли и вышли).

Затем я удалила первую строчку в обоих датасетах, потому что в них находились названия колонок на русском языке и ненужные для анализа колонки.

Original size 3790x1500

Теперь я приступила к подготовке данных для построения графиков.

Для круговой диаграммы по статусам станций был использован метод value_counts. В переменные labels и sizes я положила названия статусов и количество станций соответственно.

Original size 3790x900

Для столбчатой диаграммы по топу веток с наибольшим и наименьшим количеством станций я использовала метод value_counts и затем отсортировала полученное значение сначала по убыванию, потом по возрастанию и взяла первые 5 значениий для каждой сортировки.

Original size 3790x700

Далее идет точечный график для пассажиропотока по веткам московского метро за 2024 год.

В начале преобразовываем строковые данные датасета в числовые. Затем создаем еще один датасет с данными за 2024 год. Добавляем в него колонку с суммой пассажиров, которые входили и выходили на каждой станции. Группируем значения по каждой ветке, суммирум и сортируем.

Original size 3790x1500

Потом для тепловой карты отделяем значения пассажиропотока Таганско-краснопресненской линии.

Также, как и в предыдущем графике, создаем колонку с суммой пассажиров.

С помощью метода pivot_table создаем сводную таблицу, в которой по вертикали будут находится года (2021-2024), по горизонтали названия станций, а в ячейках — суммы пассажиров.

Original size 3790x1500

Визуализация данных

Original size 3500x2000

Круговая диаграмма по статусам станций

0

Круговая диаграмма позволяет отчетливо увидеть настолько большое московское метро. Поскольку несмотря на большое количество строящихся станций, они занимают малую часть среди всех станций московского метрополитена.

Original size 3500x2000

Топ-5 линий с наибольшим количеством станций

0
Original size 3500x2000

Топ-5 линий с наименьшим количеством станций

Здесь используются столбчатые диаграммы, чтобы увидеть какие линии метрополитена имеют наибольшее и наименьшее количество станций. Это поможет в будущем проанализировать есть ли свзяь между размером ветки и пассажиропотоком на ней.

Original size 1188x590

Точечный график по загруженности станций

0

Точечная диаграмма показала, что самой загруженной линией является Таганско-Краснопресненская, несмотря на то, что это не самая большая ветка.

Original size 1089x590

Тепловая карта пассажиропотока

0

Тепловая карта показала какие самые загруженные станции на Таганско-краснопресненской линии московского метрополитена.

Данные по станции Китай-город отсутствовали в датасете.

Анализ московского метро
10
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more