
Вводная часть
Современный автомобильный рынок России, и Санкт-Петербурга в частности, претерпевает фундаментальную трансформацию. Массовый уход с рынка ряда западных брендов в 2022 году создал беспрецедентный вакуум, который стремительно заполняют китайские автопроизводители.
«Китайское наступление» — именно этот термин лучше всего характеризует текущую ситуацию на автомобильном рынке Санкт-Петербурга. Всего за два года городской ландшафт наполнился новыми брендами из Поднебесной, которые кардинально изменили потребительские привычки и расстановку сил в отрасли. Если ранее китайские автомобили ассоциировались с низкой ценой и сомнительным качеством, то сегодня они бросают вызов устоявшимся лидерам по уровню оснащения, дизайну и технологичности.
Из нишевых игроков они превратились в ключевых участников, предлагая потребителям технологичные, хорошо оснащенные и конкурентоспособные по цене автомобили.
Санкт-Петербург, являясь вторым по величине автомобильным рынком страны и важнейшим культурно-экономическим хабом Северо-Западного региона, представляет собой стратегически важную и высокую конкурентоспособную площадку для реализации данной продукции. Высокая покупательная способность населения, развитая дилерская инфраструктура и восприимчивость к новым брендам делают город идеальным полигоном для изучения потенциала китайского автопрома в России.
Целью данного проекта является комплексный анализ рынка продаж современных китайских автомобилей в Санкт-Петербурге. В задачи исследования входит оценка текущих объемов рынка, анализ модельного ряда и ценовой политики ключевых игроков (таких как Haval, Chery, Geely, Changan, Omoda, Exeed)
Порядок структуризации данных:

Changan Uni-K
1. Загрузка библиотек и данных
Сначала я подготовила «инструменты» для работы — загрузила специальные библиотеки (наборы готовых функций) для анализа данных и построения графиков:
pandas — для работы с таблицами данных
numpy — для математических операций
matplotlib — для создания визуализаций и графиков
Затем я настроила внешний вид будущих графиков — задала удобный размер, добавила сетку для лучшей читаемости, убрала лишние линии рамок.
Основная работа: Я загрузила данные из файла spb_clutuses_car_sales_2023_2025.csv, который содержит информацию о продажах китайских автомобилей в Санкт-Петербурге за период с 2023 по 2025 год. Особенно важно, что я сразу преобразовала столбец с датами в правильный формат, чтобы потом легко анализировать данные по времени.
Функция df.head () показала первые несколько строк таблицы, чтобы убедиться, что данные загрузились корректно и понять их структуру.
2. Очистка и нормализация
Я провела «генеральную уборку» данных, чтобы обеспечить их качество и достоверность для дальнейшего анализа.
Удалили дубликаты продаж — нашли и убрали повторяющиеся записи о продажах по уникальному идентификатору sale_id. Это гарантирует, что каждая продажа учитывается только один раз.
Отфильтровали экстремальные цены — убрали аномально низкие и высокие значения (ниже 1-го и выше 99-го процентиля). Это помогло избавиться от «выбросов» — например, цен в 10 рублей или запредельно высоких значений, которые могли бы исказить общую картину.
Добавили служебное поле — создали колонку ym (год-месяц) из даты продажи. Это упростит последующий анализ динамики продаж по месяцам.
Проверили пропущенные данные — проанализировали, в каких колонках и сколько процентов данных отсутствует, чтобы понимать полноту нашей информации.
Эта «гигиена данных» — критически важный этап. Мы убедились, что работаем с чистыми, непротиворечивыми данными, где каждая продажа уникальна, цены реалистичны, а временные периоды удобны для анализа. Это основа для любых точных выводов.
3. Ключевые метрики
На этом этапе я рассчитала основные метрики, которые помогут нам понять текущую ситуацию на рынке китайских автомобилей в Санкт-Петербурге.
Ежемесячные продажи и средняя цена — сгруппировала данные по месяцам и посчитала, сколько автомобилей было продано и по какой средней цене в каждый период. Это поможет увидеть сезонность и динамику рынка.
Доли брендов — проанализировала, как распределяются продажи между разными китайскими брендами (Chery, Haval, Geely и другими) в разрезе месяцев. Это покажет, кто лидирует на рынке и как меняется конкуренция.
Микс финансирования — посмотрела, какими способами петербуржцы чаще всего оплачивают покупки: наличные, кредит или лизинг. Это важный показатель финансового поведения клиентов.
ТОП-10 моделей — выделила самые популярные модели с начала текущего года, чтобы понять, какие именно автомобили пользуются наибольшим спросом у потребителей.
На этом этапе я перешла от подготовки данных к самому интересному — расчету ключевых показателей рынка. Эти метрики станут основой для всех дальнейших выводов и визуализаций в нашем исследовании.
4. Визуализации (оригинальный стиль на Matplotlib)
Каждый график сохраняется в папку export/ рядом с блокнотом.
Далее выводим графики
Jetour X90 Plus
График № 1.
Я создала и сохранила график, который показывает динамику ежемесячных продаж китайских автомобилей в Санкт-Петербурге в штучном выражении.
- Создала папку 'export' для сохранения графиков
- Построила линейный график по данным о продажах за каждый месяц
- Добавила заголовок и подписи осей для наглядности
- Сохранила график как изображение в высоком качестве
- Показала визуализацию в интерфейсе
Этот график позволяет наглядно увидеть сезонность продаж и общую динамику рынка китайских автомобилей в СПб за анализируемый период.
График № 2.
Я построила столбчатую диаграмму с накоплением, которая показывает распределение долей брендов на рынке китайских автомобилей в Санкт-Петербурге за последние 12 месяцев.
- Отфильтровала данные за последние 12 месяцев
- Преобразовала данные в таблицу с месяцами по горизонтали и брендами по вертикали
- Создала многоуровневую гистограмму, где каждый столбец показывает общие продажи за месяц, а цветные сегменты — вклад каждого бренда
- Добавила легенду для идентификации брендов
- Сохранила график в папку export
Этот график позволяет наглядно сравнить рыночные доли брендов и проследить их динамику помесячно, увидев, какие производители лидируют и как меняется конкурентная ситуация на рынке.
График № 3.
Я построила график динамики средней цены по брендам с использованием скользящего среднего за 3 месяца.
- Сгруппировала данные по месяцам и брендам, рассчитав среднюю цену продаж для каждой группы
- Для каждого бренда построила линию тренда с применением скользящего среднего (3 месяца), что сглаживает резкие колебания и показывает общую тенденцию
- Добавила легенду (элемент графика) с названиями брендов для удобства сравнения
- Сохранила график в папку export
Этот график позволяет отследить, как меняется ценовая политика разных китайских брендов со временем, выявить тенденции подорожания или удешевления моделей, а также сравнить позиционирование брендов на ценовой шкале рынка.
График № 4.
Я построила столбчатую диаграмму, которая показывает распределение способов финансирования покупок китайских автомобилей в Санкт-Петербурге.
- Проанализировала, какими способами покупатели оплачивают автомобили (наличные, кредит, лизинг и др.)
- Построила барчарт, где по вертикали отображается количество сделок, а по горизонтали — виды оплаты
- Добавила заголовок и подписи осей для ясности
- Сохранила график в папку export
Этот график позволяет понять финансовые предпочтения покупателей: какой процент сделок совершается за наличные, сколько покупателей используют кредиты или лизинг, что помогает оценить платёжеспособность аудитории и популярность разных финансовых инструментов на рынке.
График № 5.
Я построила горизонтальную столбчатую диаграмму, которая показывает рейтинг 10 самых продаваемых моделей китайских автомобилей в Санкт-Петербурге за текущий год.
- Отсортировала модели по количеству проданных единиц за год
- Отобрала топ-10 самых популярных моделей
- Создала барчарт, где модели перечислены по вертикали, а количество продаж показано длиной горизонтальных столбцов
- Добавила названия моделей в формате «Бренд + Модель» (например, «Omoda S5»)
- Сохранила график в папку export
Этот график наглядно демонстрирует, какие конкретные модели пользуются наибольшим спросом у петербуржцев, позволяя идентифицировать абсолютных лидеров рынка и сравнить их популярность между собой.
5. Экспорт подготовленных данных
На завершающем этапе я сохранила все подготовленные и очищенные данные в удобном формате для дальнейшего использования.
brand_by_month.csv — сводная таблица с продажами по брендам в разрезе каждого месяца
monthly_units.csv — данные по ежемесячным продажам в штучном выражении
clean_sales.csv — окончательная очищенная версия исходного датасета со всеми продажами
- Сводная таблица по месяцам и брендам
- Финальный CSV
Экспортированные файлы содержат готовые к анализу данные, которые можно использовать для передачи данных в конце презентации анализа.
Все файлы сохранены в папку export в формате CSV, который легко открывается в Excel и других аналитических инструментах.