
Вводная часть
В рамках проекта был проанализирован набор данных day.csv, содержащий информацию о ежедневных арендах городских велосипедов за период 2018–2019 годов. Датасет включает сведения о количестве аренд, типах пользователей (casual и registered), сезонных и календарных характеристиках, а также погодных условиях.
Выбор данных обусловлен их социальной и урбанистической значимостью: городской велопрокат является важной частью современной транспортной системы и отражает повседневные поведенческие паттерны горожан. Анализ подобных данных позволяет понять, как меняется ритм города в зависимости от времени, погоды и типа дня.
Для визуализации были выбраны разные типы графиков — линейные, столбчатые, гистограммы, boxplot и точечные диаграммы. Такой набор позволяет одновременно показать общую динамику, распределения значений и взаимосвязи между показателями.
Этапы работы

Работа началась с загрузки и первичного анализа данных таблицы Bike Sharing Dataset из Kaggle с помощью библиотеки Pandas. Были изучены структура таблицы, типы данных и базовые статистические показатели. Пропусков в данных обнаружено не было. Для удобства интерпретации был создан дополнительный категориальный признак, разделяющий дни на будние и выходные.
Далее данные были сгруппированы и агрегированы для анализа средних значений, распределений и различий между категориями. Для визуализации использовались библиотеки Matplotlib и Seaborn.
В процессе работы применялся искусственный интеллект (ChatGPT) для консультаций по выбору типов визуализаций, оптимизации кода и формулировке аналитических выводов. Все решения по стилю, структуре и интерпретации данных принимались и дорабатывались автором проекта.
Визуальный стиль и оформление
Все графики выполнены в едином визуальном стиле с использованием авторской цветовой палитры, вдохновлённой городской средой. В палитре используются графитовый чёрный как базовый цвет, холодный синий для основных данных, акцентный оранжевый для ключевых элементов, серо-голубой для второстепенных показателей и приглушённый зелёный как отсылка к экологической составляющей городского транспорта.
Параметры шрифтов, цветов и сетки заданы непосредственно в коде, без дополнительной постобработки в графических редакторах. Это обеспечивает визуальную консистентность и воспроизводимость инфографики.
Цветовая палитра
Итоговые визуализации и выводы
Столбчатые диаграммы
Сравнение среднего количества аренд в будние и выходные дни показывает, что в будни сервис используется активнее. Это указывает на то, что городской велопрокат выполняет прежде всего транспортную функцию и используется как часть повседневных маршрутов — для поездок на работу, учёбу и по делам.
Анализ структуры пользователей демонстрирует, что основную долю спроса формируют зарегистрированные пользователи. Это говорит о стабильной и лояльной аудитории сервиса, использующей велопрокат регулярно. Casual-пользователи вносят меньший вклад и, вероятно, используют сервис эпизодически.
Boxplot
Boxplot, отражающий распределение количества аренд по сезонам, наглядно показывает выраженную сезонность спроса. В тёплые сезоны медианные значения выше, а разброс значений шире, что говорит о большей вариативности поведения пользователей. В холодные сезоны спрос снижается и становится более стабильным, без резких пиков.
Точечная диаграмма
Точечная диаграмма демонстрирует положительную зависимость между температурой воздуха и количеством аренд. По мере роста температуры увеличивается и спрос на велопрокат. Это подтверждает, что погодные условия являются одним из ключевых факторов, влияющих на решение пользователей воспользоваться велосипедом.
Регрессионный график
Регрессионный график показывает общую отрицательную тенденцию: при увеличении влажности количество аренд снижается. Несмотря на разброс данных, линия тренда указывает на то, что высокая влажность воспринимается пользователями как неблагоприятное условие для поездок, снижая общую активность.
Линейный график
Линейный график отражает ритм использования сервиса во времени. Хорошо прослеживаются сезонные волны спроса с постепенным ростом в тёплые периоды и снижением в холодные. Отсутствие резких аномалий указывает на устойчивость сервиса и предсказуемость пользовательского поведения.
Гистограмма
Гистограмма распределения общего количества аренд за день показывает, что большинство значений сосредоточено в среднем диапазоне, а экстремально высокие значения встречаются редко. Это говорит о стабильном уровне спроса с отдельными пиковыми днями, вероятно связанными с благоприятной погодой или сезонными факторами.
Заключение
Анализ данных городского велопроката показывает, что за сухими числовыми показателями скрывается живой и устойчивый ритм города. Поведение пользователей формируется не случайно, а в тесной связи с повседневными сценариями жизни мегаполиса: рабочими буднями, сезонными изменениями и погодными условиями. Велопрокат выступает не просто сервисом досуга, а полноценным элементом городской инфраструктуры, встроенным в ежедневные маршруты горожан.
Визуализация данных позволила перевести абстрактные статистические величины в наглядные образы, где каждая диаграмма отражает конкретный аспект городской динамики. Температура, влажность, тип дня и структура аудитории формируют сложную, но читаемую систему взаимосвязей, которая делает поведение пользователей предсказуемым и осмысленным. При этом наибольшую роль играет регулярная аудитория зарегистрированных пользователей, что подчёркивает интеграцию сервиса в повседневную городскую жизнь.