Original size 1140x1600

Обучение генеративной нейросети Stable Diffusion под стиль Souther Salazar

PROTECT STATUS: not protected
7

Саутер Салазар (Souther Salazar) — художник из Портленда, известный своими яркими иллюстрациями и инсталляциями бесконечных миров с фантастическими ландшафтами и героями. В своих работах художник использует множество слоев и неограниченную цветовую палитру, создавая живые и разнообразные вселенные. Мне стало интересно обучить нейросеть StableDiffsion под необычный стиль Саутера и посмотреть насколько хорошо она сможет отобразить красочность и многогранность, которые присущи стилистике художника.

Souther Salazar, «A Little Bird Told Me» // Souther Salazar, «Half Asleep»

Souther Salazar, «Cave of Dreams» // Souther Salazar, «The Long Way Home»

Важнее всего было, чтобы нейросеть смогла передать в сгенерированных изображениях многофигурную композицию и обилие разных элементов.

Описание применения генеративной модели

Для обучения модели были отобраны все работы Салазара, которые являются картинами, с его сайта, всего их составило 26 штук. Каждая была подогнана под размер 1024×1024 пикселя. Далее использовался готовый код из лекции с изменением папок и названием модели.

big
Original size 1222x711

Импорт необходимых библиотек

0

Загрузка всех изображений и проверка на корректную работу кода (загрузка превью)

0

Создание подписей к каждому изображению

Далее необходимо было сгенерировать токен на сайте HuggingFace и загрузить его в систему в самом коде. После, можно было приступать к обучению модели. Для этого были выбраны следующие параметры: разрешение было поставлено на 512 в пользу ускорения процесса, шаг обучения составлял 1000, автосохранение происходило каждые 250 шагов. В итоге весь процесс обучения составил 1 час 15 минут.

0

Обучение модели

Original size 1576x713

Загрузка модели на Hugging Face

Original size 1367x491

Генерация изображений

Сгенерированные изображения

Сгенерированное изображение // Оригинал Промпт — «art in SOUTHER SALAZAR style, landscape with abstract flowers»

На первом сгенерированном изображении уже прослеживаются характерные особенности стиля Саутера Салазара. Модель хорошо передала разнообразие в формообразовании объектов, а также цветовую палитру.

0

Промпт — «art in SOUTHER SALAZAR style, landscape with abstract flowers»

Промпт — «art in SOUTHER SALAZAR style, Majestic floating islands surrounded by clouds, with waterfalls falling into the endless sky and vibrant colors»

Нейросеть хорошо передает атмосферу и шумность окружения, однако все изображаемые элементы достаточно абстрактны и не распознаваемы, в работах Саутера Салазара объекты все же считываются, хоть и тоже могут относиться к абстракциям.

Далее я решила сгенерировать изображения, где акцент будет на живых существах.

Original size 1024x1024

Промпт — «art in SOUTHER SALAZAR style, A little dragon who befriends children and flies with them over the magical kingdom»

Промпт — «art in SOUTHER SALAZAR style, A vibrant forest with talking trees and friendly animals»

Всё-таки генерация живых существ у модели происходит менее удачно, чем дальних планов разных окружений. Отдельные объекты все же считываются, но все равно от просмотренного остается ощущение неполноты картины.

Промпты — «art in SOUTHER SALAZAR style, A hidden garden full of wonderful plants, fairy creatures and magical artifacts, illuminated by soft light», «art in SOUTHER SALAZAR style, a magical castle»

0

Промпты — «art in SOUTHER SALAZAR style, A snowy landscape with ice castles, sparkling snowflakes and cheerful snowmen p», «art in SOUTHER SALAZAR style, an underwater ecosystem with colorful corals»

После еще ряда сгенерированных изображений с пейзажами, я сделала вывод, что в целом нейросеть смогла передать стиль и основные особенности художника, такие как разнообразие цветовой палитры, многослойность, наложение объектов друг на друга, необычное и непохожее друг на друга формообразование. Однако, это все еще не может быть заменой самому художнику, поскольку у модели есть проблемы с генерацией живых существ (они либо смазанные, либо поломанные), от чего в итоге получается некая каша на изображении.

0

Промпты — «art in SOUTHER SALAZAR style, Majestic mountains with green slopes, waterfalls and small villages located at altitude», «art in SOUTHER SALAZAR style, A wide desert with golden dunes»

Генеративные ИИ и сайты, использованные в проекте: - StabbleDiffusion; - HugginFace; - ChatGPT 3.5 (для генерации промптов); - Google Colab

Обучение генеративной нейросети Stable Diffusion под стиль Souther Salazar
7
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more