Original size 1140x1600

Обучение Stable Diffusion под стиль Рината Волигамси

PROTECT STATUS: not protected
8
КОНЦЕПЦИЯ

Ринат Волигамси — современный художник, который работает на стыке реализма и сюрреализма с элементами советской визуальной культуры. Его работы часто выглядят как кадры из старых советских архивов: будничные сцены, военные фото, простые бытовые эпизоды. Но если приглядеться, в них всегда можно заметить какие-то странности, за которыми скрывается ироничная, абсурдная, а порой и тревожная реальность.

Именно это делает его стиль особенно интересным для генеративной нейросети: она должна научиться не просто воспроизводить эстетику «ретро-фото», но и чувствовать момент, когда реальность начинает «ломаться».

ИСХОДНЫЕ ИЗОБРАЖЕНИЯ
big
Original size 5260x1223

Характерный приём Волигамси — вплетение в банальные образы элементов сна, вымысла, нелогичности. Отсюда возникает ощущение «тихого сюра», будто привычный мир внезапно сдвинулся со своей оси. Так в его работах можно увидеть человека, идущего по потолку; солдата, разговаривающего со своим двойником; множество клонов одного и того же персонажа, занятых бытовыми делами. Это визуальные парадоксы, которые при этом не нарушают логику изображения: Волигамси показывает, что сюрреализм может быть найден не в диковинном, а в самом обыденном.

big
Original size 5260x2748

Для обучения модели я собрала датасет из 89 изображений, взятых с официального сайта Рината Волигамси. В подборку вошли фрагменты и полные версии его работ разных лет — как живописных, так и графических.

Основной критерий отбора — узнаваемость стиля. Я старалась включить работы, в которых особенно чётко выражены характерные для художника визуальные приёмы: повторяющиеся фигуры, сцены повседневной жизни, элементы, нарушающие логику изображения.

Все изображения были приведены к квадратному формату (1:1) и масштабированы до нужного размера для обучения. Количество — 89 — оказалось достаточным для того, чтобы модель смогла уловить основные особенности стиля и начать генерировать изображения, близкие к оригиналам.

ПРОЦЕСС ОБУЧЕНИЯ

Для обучения генеративной модели я использовала Stable Diffusion XL в связке с методами DreamBooth и LoRA. Это позволило адаптировать большую предобученную нейросеть под конкретный визуальный стиль, даже при не очень большом объёме данных.

Original size 1137x603
СЕРИЯ СГЕНЕРИРОВАННЫХ ИЗОБРАЖЕНИЙ

В результате обучения получилась серия изображений, которая стилистически близка к оригинальным работам Рината Волигамси. Модель уверенно воспроизводит общее настроение, характерное для его работ: немного приглушённую палитру, сдержанные композиции и ощущение «странности» внутри обычных сцен. Особенно хорошо нейросеть справилась с пейзажами. Итоговые изображения были улучшены с помощью нейросети Let’s Enhance, что позволило повысить их качество и детализацию

Original size 2288x2284

promt: painting in VOLIGAMI style, street, moscow

Кроме общего стиля, нейросеть смогла уловить и более специфические визуальные приёмы, характерные для работ Волигамси. Например, она хорошо считывала паттерны и замены форм, которые часто встречаются у художника — такие как мухи, напоминающие вертолёты, или голуби, схожие по силуэту с динозаврами. Подобные детали придают изображениям странный, почти абсурдный эффект, и в сгенерированных вариантах эта логика также прослеживается.

Это говорит о том, что модель научилась не просто копировать внешние черты, но и перенимать внутреннюю логику построения образов — когда обычный объект вдруг приобретает не совсем привычную форму или смысл.

prompt: painting in VOLIGAMSI style, flies on red Square. add light points

Original size 2060x2060

promt: painting in VOLIGAMSI style, flies on the head of a person

Original size 5221x1680

слева направо: promt: painting in VOLIGAMSI style, standing people at the cemetery; painting in VOLIGAMSI style, portrait; painting in VOLIGAMSI style, urban random, light

слева направо: promt: painting in VOLIGAMSI style, a house; painting in VOLIGAMSI style, urban random, light

promt: painting in VOLIGAMSI style, time stopped

С изображением человека нейросети было работать сложнее. У Рината Волигамси фигуры людей часто выглядят стилизованно — они силуэтные, немного расплывчатые, почти трафаретные, без проработки лиц и лишних деталей. Это придаёт образам обобщённость и делает их похожими на архивные фото или фрагменты из сна.

Модель пыталась воспроизвести этот подход: в некоторых генерациях фигуры действительно теряют чёткие контуры, становятся условными, сдержанными по цвету и позе. Но в других случаях нейросеть всё же стремилась прорисовать лица или добавляла лишние детали, которые выбиваются из общего стиля.

Original size 2288x2284

prompt: painting in VOLIGAMSI style, сhildren playing jump rope with a telephone cord, their shadows morphing into stretched prison bars

Тем не менее, попытки сохранить характерную «размытость» и отсутствие индивидуальности в изображении людей были заметны, особенно в контексте общей композиции.

слева направо: prompt: painting in VOLIGAMSI style, сhildren playing jump rope with a telephone cord, their shadows morphing into stretched prison bars; painting in VOLIGAMSI style, walking body parts

Original size 2288x2066

promt: painting in VOLIGAMSI style, A funeral procession where the mourners carry empty picture frames, their own faces fading. Slow-motion dream, foggy atmosphere, monochrome with one muted color

Original size 2048x2048

promt: painting in VOLIGAMSI style, people with animal bodies

Original size 5221x2430

promt: painting in VOLIGAMSI style, A black-and-white artwork featuring an elderly woman in a dark standing on snow while extending her hand toward a group of small, dinosaur-like creatures

ЗАКЛЮЧЕНИЕ

В ходе проекта мне удалось обучить нейросеть на изображениях в стиле Рината Волигамси, что позволило модели создавать работы, схожие по настроению и ключевым особенностям его стиля. Результаты показали хорошее воспроизведение пейзажей и абсурдных паттернов, хотя с изображениями людей нейросеть справилась не так идеально.

Обучение Stable Diffusion под стиль Рината Волигамси
8
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more