Original size 2773x3923

Моменты тишины

PROTECT STATUS: not protected
The project is taking part in the competition

Серия иллюстраций, которая фиксирует не события, а состояния — моменты наблюдения, тишины и внутреннего напряжения. Приглушённая палитра и условное пространство создают ощущение памяти, сна или старой визуальной хроники.

За основу для обучения нейросети были взяты картины Анри де Тулуз-Лотрек с его уникальным стилем.

В итоговой серии ожидалось увидеть такую же легкость и непринужденность, которая есть в оригинальных картинах. Сочетание цветов, мазков и стилистики дали бы необходимые для концепции ощущение тишины и сна.

1. Этапы процесса обучения

Датасет (картинки) ↓ Авто-разметка через BLIP (caption_images) ↓ Добавление специального токена к каждому описанию ↓ Обучение LoRA-адаптера поверх SDXL ↓ Сохранение весов адаптера (~несколько МБ)

2. Разбор параметров тренировки

| Параметр | Значение | Смысл | |---|---|---| | mixed_precision=fp16 | float16 | Половинная точность → меньше VRAM | | use_8bit_adam | — | Оптимизатор с квантизацией → экономия памяти | | learning_rate=1e-4 | 0.0001 | Шаг обновления весов | | max_train_steps=750 | — | Количество итераций обучения | | train_batch_size=4 | — | Количество примеров за один шаг | | gradient_accumulation_steps=1 | — | Накопление градиентов перед обновлением | | snr_gamma=5.0 | — | Балансировка шума на разных timestep’ах диффузии | | lr_scheduler=constant | — | Скорость обучения не меняется в процессе | | checkpointing_steps=250 | — | Сохранение чекпоинта каждые 250 шагов |

3. Роль BLIP в пайплайне

BLIP — это мультимодальная модель, которая генерирует текстовые описания изображений (image captioning). Она нужна, чтобы автоматически разметить датасет:

картинка → BLIP → «a woman sitting at a table» + prefix → «painting in TOULOUSE-LAUTREC style, a woman sitting at a table»

Итоговое описание записывается в metadata.jsonl — стандартный формат для датасетов HuggingFace.

4. Итог

После обучения получается LoRA-адаптер — небольшой файл с весами, который можно подключить к SDXL и генерировать изображения в стиле Тулуз-Лотрека, просто упомянув токен в промпте.

В итоге получились изображения, соответствующие требованиям концепции и с хорошо узнаваемым стилем оригинального художника.

Моменты тишины
Project created at 23.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more