Original size 1140x1600

Генерация в стиле Formula 1 с использованием Stable Diffusion и LoRA

Тема проекта

Обучение модели Stable Diffusion с применением LoRA-адаптации по набору изображений машин формулы 1, чтобы модель могла создавать новые оригинальные изображения гоночных болидов.

Концепция

Проект исследует возможности генеративных нейросетей в области современного искусства. С помощью дообучения Stable Diffusion по набору изображений машин формулы 1 была создана модель, способная воспроизводить цветовую выразительность, ритм и энергетику, характерные для формулы 1. Результатом стало создание серии изображений машин, где искусственный интеллект не просто имитирует стиль ф1, а формирует собственный визуальный язык.

Исходные изображения для обучения

Результаты генерации

Каждое изображение сгенерировано по одному из случайных промптов из заранее подготовленного списка, описывающего стиль формулы 1 («dynamic motion abstraction», «color field composition», «geometric abstraction», «kinetic energy composition», «metallic light reflections» и т. д.).

Развёрнутый комментарий и визуальный анализ

Общий результат:

После обучения нейросеть начала уверенно распознавать базовые элементы композиции автогоночных сцен — трассу, болид, фоновую публику, ограждения, элементы пит-лейна. В итоговой серии присутствует как реалистичная, так и стилизованная визуализация движения. Некоторые кадры имитируют фотографии с длинной выдержкой, другие — статичные репортажные снимки с динамическим фоном.

Положительные результаты:

Модель передаёт характерную пластику движения — размытые колёса, следы шин, градиенты света.

В удачных примерах болид имеет корректные пропорции, точные отражения на корпусе, реалистичную аэродинамическую форму.

Хорошо проявляется динамическое освещение: дневной солнечный свет, искусственные прожекторы, закатные тона.

Модель научилась создавать композиции с перспективой — трасса уходит вдаль, присутствует ощущение пространства и скорости.

Неудачные случаи:

В ряде изображений наблюдались ошибки структуры и визуальные артефакты, типичные для генеративных моделей, работающих с техническими объектами:

деформации кузова — искажённые колёса, удлинённые или раздвоенные передние спойлеры;

неверная текстура шин — иногда вместо протектора появлялись гладкие тени или зеркальные поверхности;

неестественные позы пилотов — шлемы без стекла, искажения рук, лишние элементы кокпита;

фоновые ошибки — «плавающие» заборы, обрывки надписей спонсоров, случайные логотипы;

чрезмерное размывание объектов, особенно при попытке имитировать эффект скорости.

Эти артефакты можно объяснить недостаточным количеством корректных примеров в обучающем наборе, а также высокой сложностью формы болида, требующей точных геометрических данных.

Jupyter/Colab ноутбук

https://drive.google.com/drive/folders/1bFl-BDBXeZxPFte1g6sbxeEYCtnUwlOU?usp=sharing

Использование GenAI

В рамках проекта дополнительно использовался ChatGPT (GPT-4о) для разработки и уточнения промптов, составления текстовых описаний (caption-пар), формулировки концепции, редактирования и структурирования текстов.

Генерация в стиле Formula 1 с использованием Stable Diffusion и LoRA

Anita Grichanaya

artificial intelligence

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...