Original size 1140x1600

Генерация в стиле Formula 1 с использованием Stable Diffusion и LoRA

PROTECT STATUS: not protected
3

Тема проекта

Обучение модели Stable Diffusion с применением LoRA-адаптации по набору изображений машин формулы 1, чтобы модель могла создавать новые оригинальные изображения гоночных болидов.

Концепция

Проект исследует возможности генеративных нейросетей в области современного искусства. С помощью дообучения Stable Diffusion по набору изображений машин формулы 1 была создана модель, способная воспроизводить цветовую выразительность, ритм и энергетику, характерные для формулы 1. Результатом стало создание серии изображений машин, где искусственный интеллект не просто имитирует стиль ф1, а формирует собственный визуальный язык.

Исходные изображения для обучения

0

Результаты генерации

0

Каждое изображение сгенерировано по одному из случайных промптов из заранее подготовленного списка, описывающего стиль формулы 1 («dynamic motion abstraction», «color field composition», «geometric abstraction», «kinetic energy composition», «metallic light reflections» и т. д.).

Развёрнутый комментарий и визуальный анализ

Общий результат:

После обучения нейросеть начала уверенно распознавать базовые элементы композиции автогоночных сцен — трассу, болид, фоновую публику, ограждения, элементы пит-лейна. В итоговой серии присутствует как реалистичная, так и стилизованная визуализация движения. Некоторые кадры имитируют фотографии с длинной выдержкой, другие — статичные репортажные снимки с динамическим фоном.

Положительные результаты:

Модель передаёт характерную пластику движения — размытые колёса, следы шин, градиенты света.

В удачных примерах болид имеет корректные пропорции, точные отражения на корпусе, реалистичную аэродинамическую форму.

Хорошо проявляется динамическое освещение: дневной солнечный свет, искусственные прожекторы, закатные тона.

Модель научилась создавать композиции с перспективой — трасса уходит вдаль, присутствует ощущение пространства и скорости.

Неудачные случаи:

В ряде изображений наблюдались ошибки структуры и визуальные артефакты, типичные для генеративных моделей, работающих с техническими объектами:

деформации кузова — искажённые колёса, удлинённые или раздвоенные передние спойлеры;

неверная текстура шин — иногда вместо протектора появлялись гладкие тени или зеркальные поверхности;

неестественные позы пилотов — шлемы без стекла, искажения рук, лишние элементы кокпита;

фоновые ошибки — «плавающие» заборы, обрывки надписей спонсоров, случайные логотипы;

чрезмерное размывание объектов, особенно при попытке имитировать эффект скорости.

Эти артефакты можно объяснить недостаточным количеством корректных примеров в обучающем наборе, а также высокой сложностью формы болида, требующей точных геометрических данных.

Jupyter/Colab ноутбук

Использование GenAI

В рамках проекта дополнительно использовался ChatGPT (GPT-4о) для разработки и уточнения промптов, составления текстовых описаний (caption-пар), формулировки концепции, редактирования и структурирования текстов.

Генерация в стиле Formula 1 с использованием Stable Diffusion и LoRA
3
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more