Original size 692x1024

Обученин генеративной нейросети под стиль художника Глеба Баранова

PROTECT STATUS: not protected

Идея проекта

Учебный проект направлен на дообучение модели Stable Diffusion на стиль конкретного автора. Я остановила свой выбор на одном из своих любимых художников — Глебе Баранове. Мне близки его визуальный стиль, метод работы, текстуры, цвета, образы, которые он создает. Идеей проекта стало исследование возможностей генеративной нейросети в создании изображений, выдержанных в индивидуальной и специфичной стилистике.

Глеб Баранов — художник из Краснодара, который работал на судне в Персидском заливе и в своих работах неизменно обращается к личному опыту. Его картины посвящены историям о волшебном мире, который скрыт от людских глаз. Этот мир выражается через символы и знаки. Художник воспринимает это символическое измерение и демонстрирует его нам в виде текста, который также представляет собой систему знаков. Связи между объектами остаются невидимыми, и сюжет, кажется, отсутствует. Этот прием важен для создания иррациональных связей, которые функционируют внутри картин.

Исходные изображения для обучения

0

Процесс обучения

Установила библиотеки bitsandbytes, transformers, diffusers, peft (параметрическая настройка, включая LoRA), скрипт для обучения Dreambooth-LoRA.

Original size 789x153

Загрузила исходных 23 изображения для обучения. Использовала технику Dreambooth-LoRA для дообучения Stable Diffusion.

Использовала базовые модели: stabilityai/stable-diffusion-xl-base-1.

VAE madebyollin/sdxl-vae-fp16-fix

Выставила следующие параметры: Разрешение: 512×512 Batch size: 2 Learning rate: 1e-4 Количество шагов: 500 FP16

Далее запустила обучение через accelerate

Original size 853x341

Итог

При первой попытке нейросеть правильно считала промпты, но отошла от стиля художника

Original size 940x940

Промт: «A painting in the style of Gleb Baranov, an irrational image of a white panther with wings lying next to an open box, against a background of pastel-colored clouds and an Arabian-style castle.

Далее нейросеть стала более точно воспроизводить стиль художника, но на изображениях можно было видеть очевидные деффекты.

Original size 940x940

Промт: «A painting in the style of Gleb Baranov, two white tigers with black stripes and red eyes are jumping on green grass, with a blue sky and a golden cup with a fire burning inside visible from b

Original size 940x940

Промт: «A painting in the style of Gleb Baranov, a white panther with green wings and a pink heart on its forehead flies across the sky and holds a sword with a gold handle and made of pink metal in i

Original size 940x940

Промт: «A painting in the style of Gleb Baranov, white tigers with dark blue stripes and protruding tongues frolic in the river, in the laboratory paintings a small pink and green fountain is visible.

В процессе дообучения удалось достичь удовлетворительного результата с небольшими отхождениями от промпта

Original size 940x940

Промт «A painting in the style of Gleb Baranov, a panther with wings closed his eyes and sits by the lake»

Original size 940x940

Промт: «A painting in the style of Gleb Baranov, an irrational, bright image of a black panther with its tongue hanging out sitting on a golden throne, with golden jugs nearby containing a burning fir

Original size 940x940

Промт: «A painting in the style of Gleb Baranov, a white panther with pink wings and a protruding tongue sits on the shore of a lake and plays the harp, a full moon and flowering trees are visible in

Original size 940x940

A painting in the style of Gleb Baranov, two panthers, one white with red wings, the other black with white wings, sit on a Persian carpet, lie on green grass, against a background of pastel orange sk

Ссылка на блокнот с кодом

Обученин генеративной нейросети под стиль художника Глеба Баранова
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more