
Рынок подержанных автомобилей является одним из наиболее динамичных сегментов автомобильной индустрии. Цена автомобиля формируется под влиянием множества факторов, таких как пробег, год выпуска, тип топлива и мощность двигателя.
В рамках данного проекта проводится анализ данных о подержанных автомобилях с целью выявления ключевых зависимостей между их характеристиками и стоимостью.
В работе используется датасет autoscout24, содержащий информацию об объявлениях о продаже подержанных автомобилей на европейском рынке. Что в данных: цена автомобиля пробег год выпуска мощность двигателя тип топлива
Датасет содержит более 46 000 записей, что позволяет проводить анализ на репрезентативной выборке.
Графики

График 1. Цена и пробег
На графике наблюдается выраженная отрицательная зависимость между пробегом автомобиля и его стоимостью. При небольшом пробеге разброс цен достаточно велик, что связано с различиями в классе и характеристиках автомобилей. По мере увеличения пробега максимальная цена автомобилей снижается.

График 2. Цена и мощность двигателя
График демонстрирует положительную зависимость между мощностью двигателя и стоимостью автомобиля. Более мощные автомобили, как правило, имеют более высокую цену, однако зависимость не является строго линейной.
График 3. Год выпуска и пробег
Видно, что более новые автомобили в среднем имеют меньший пробег, что отражает логичную связь между возрастом автомобиля и интенсивностью его эксплуатации.
График 4. Распределение цен по типу топлива
Boxplot позволяет сравнить распределение цен автомобилей в зависимости от типа топлива. Электрические автомобили характеризуются более высоким уровнем цен и большим разбросом значений. Бензиновые автомобили, в свою очередь, чаще представлены в более доступном ценовом сегменте.
График 5. Средняя цена по году выпуска
График показывает рост средней стоимости автомобилей с увеличением года выпуска, что подтверждает влияние возраста автомобиля на его рыночную цену.
График 6. Распределение пробега
Большинство автомобилей на рынке подержанных авто имеют пробег до 200 000 км, при этом количество автомобилей с большим пробегом постепенно снижается
Визуальный стиль
Для визуализации данных был выбран единый тёмный стиль с контрастными акцентами, вдохновлённый эстетикой спортивных автомобилей. Такой подход позволил улучшить визуальное восприятие графиков и подчеркнуть связь между тематикой проекта и визуальным оформлением.
Описание применения генеративной модели
В процессе работы над проектом использовалась генеративная модель искусственного интеллекта (ChatGPT) для консультаций по структуре кода, выбору методов визуализации и формулированию текстовых описаний. Все аналитические выводы были сделаны на основе самостоятельного анализа данных.
Ссылка на датасет и блокнот с кодом:
https://drive.google.com/drive/folders/1l2TwB7WiiDSJ0d9k6L8httj0BXqDDo2l?usp=sharing