
Тема проекта
Обучение модели Stable Diffusion с применением LoRA-адаптации по набору изображений машин формулы 1, чтобы модель могла создавать новые оригинальные изображения гоночных болидов.
Концепция
Проект исследует возможности генеративных нейросетей в области современного искусства. С помощью дообучения Stable Diffusion по набору изображений машин формулы 1 была создана модель, способная воспроизводить цветовую выразительность, ритм и энергетику, характерные для формулы 1. Результатом стало создание серии изображений машин, где искусственный интеллект не просто имитирует стиль ф1, а формирует собственный визуальный язык.
Исходные изображения для обучения
Результаты генерации
Каждое изображение сгенерировано по одному из случайных промптов из заранее подготовленного списка, описывающего стиль формулы 1 («dynamic motion abstraction», «color field composition», «geometric abstraction», «kinetic energy composition», «metallic light reflections» и т. д.).
Развёрнутый комментарий и визуальный анализ
Общий результат:
После обучения нейросеть начала уверенно распознавать базовые элементы композиции автогоночных сцен — трассу, болид, фоновую публику, ограждения, элементы пит-лейна. В итоговой серии присутствует как реалистичная, так и стилизованная визуализация движения. Некоторые кадры имитируют фотографии с длинной выдержкой, другие — статичные репортажные снимки с динамическим фоном.
Положительные результаты:
Модель передаёт характерную пластику движения — размытые колёса, следы шин, градиенты света.
В удачных примерах болид имеет корректные пропорции, точные отражения на корпусе, реалистичную аэродинамическую форму.
Хорошо проявляется динамическое освещение: дневной солнечный свет, искусственные прожекторы, закатные тона.
Модель научилась создавать композиции с перспективой — трасса уходит вдаль, присутствует ощущение пространства и скорости.
Неудачные случаи:
В ряде изображений наблюдались ошибки структуры и визуальные артефакты, типичные для генеративных моделей, работающих с техническими объектами:
деформации кузова — искажённые колёса, удлинённые или раздвоенные передние спойлеры;
неверная текстура шин — иногда вместо протектора появлялись гладкие тени или зеркальные поверхности;
неестественные позы пилотов — шлемы без стекла, искажения рук, лишние элементы кокпита;
фоновые ошибки — «плавающие» заборы, обрывки надписей спонсоров, случайные логотипы;
чрезмерное размывание объектов, особенно при попытке имитировать эффект скорости.
Эти артефакты можно объяснить недостаточным количеством корректных примеров в обучающем наборе, а также высокой сложностью формы болида, требующей точных геометрических данных.
Jupyter/Colab ноутбук
Использование GenAI
В рамках проекта дополнительно использовался ChatGPT (GPT-4о) для разработки и уточнения промптов, составления текстовых описаний (caption-пар), формулировки концепции, редактирования и структурирования текстов.