Original size 1360x1920

Обучение нейросети стилю loish

PROTECT STATUS: not protected
8

Концепция

Я очень люблю стиль рисования художницы loish. В основном она изображает девушек в динамичных позах с развивающимися цветными волосами. Также у неё запоминающаяся графика, часто видно штрихи, а ещё интересно, что персонажи художницы схожи чертами лиц между собой и с ней самой. Так как у loish очень колоритный и интересный стиль, я решила обучить нейросеть Stable Diffusion на её артах.

Исходные изображения

Я собрала датасет из 40 изображений, предварительно подогнав их под разрешение 512×512px.

big
Original size 4630x1828
0

Процесс обучения

Я решила работать в Google Colab. Сначала я создала директорию для изображений, которые будут использоваться для обучения нейросети, и загрузила в неё все файлы.

Original size 1600x630

Далее я использовала BLIP для автоматического создания подписей к картинкам, которые нужны для обучения нейросети. Также добавила к описаниям идентификатор токена концепции «LOISH-style art», записав всё в jsonl-файл.

0

Следующим шагом освободила память и подготовила всё для обучения.

Original size 1600x363

Я решила обучать нейросеть на изображениях 512×512, но задать более высокие показатели для большей точности модели. Обучение заняло около 1,5 часов.

Original size 1600x609

Далее сохранила модель, запустила и начала генерировать картинки.

Original size 1600x243
Original size 1600x623
Original size 1600x630
Original size 1600x651

Результат

Я генерировала изображения, свойственные артам loish. Создавала и просто персонажей, и немного сюжетные сцены.

Original size 2078x1024

«LOISH-style art, a painting of a shy woman with lond hair, blue, green and purpur», «LOISH-style art, a painting of a shy woman with lond hair, blue and purpur»

Модель хорошо передала стиль и черты персонажей художницы.

Original size 2078x1024

«LOISH-style art, a woman with long black hair and a blue shirt holding a pink rose», «LOISH-style art, a woman in a dress and short hair holding pumpkins»

Original size 2078x674

«LOISH-style art, a woman with a bird on her shoulder», «LOISH-style art, a white woman with a bird on her shoulder, blue and purpur», «LOISH-style art, a woman with a bird on her shoulder, blue»

В сложных позах и ракурсах конечности часто получались странноватыми, иногда было несколько рук или положение кистей выглядело неестественно.

Original size 2078x1024

«LOISH-style art, a white woman with long hair swims underwater», «LOISH-style art, a white woman with long black hair swims blue underwater»

Original size 2078x1024

«LOISH-style art, a woman with a black hair and a white face», «LOISH-style art, a woman with a black hair and a white face, a heart in her hands»

В датасете для обучения нейросети было всего две картинки с таким дымным эффектом, однако модель очень хорошо справилась с генерацией подобных изображений.

Original size 2078x1024

«LOISH-style art, a woman with a black hair and a red flame», «LOISH-style art, a woman with a black hair and a white face, a flame in her hands»

Original size 2078x1024

«LOISH-style art, a painting of a woman standing in front of a large flower», «LOISH-style art, a painting of a woman with lond hair standing in front of a large flower, blue, green and purpur»

Original size 2078x1024

«LOISH-style art, a woman in a blue dress with a long hair and a flowing flowing dress», «LOISH-style art, a woman with long black hair and a blue dress»

Я пробовала писать одинаковые промпты, но задавать разные цвета, что в результате показалось довольно интересным.

Original size 2078x674

«LOISH-style art, a woman with a raccoon», «LOISH-style art, a woman with a raccoon, blue and green», «LOISH-style art, a woman with a long hair and a raccoon, blue»

Также я попробовала создать изображения с котом, которого не было в датасете. Модель отлично передала стиль, котики хорошо получились.

Original size 2078x1024

«LOISH-style art, a woman with a cat», «LOISH-style art, a woman with a long hair and a cat, blue»

Original size 2078x1024

«LOISH-style art, a woman with long hair and a snake in her hand», LOISH-style art, a woman with a snake on her head

Original size 2078x1024

«LOISH-style art, a woman with red and blue hair is dancing», «LOISH-style art, a woman with blue hair is dancing»

В целом нейросеть достаточно хорошо следовала промпту и получались ожидаемые изображения.

Вывод

Модель смогла довольно точно передать стиль художницы. Прослеживается динамичность поз и легкость в движениях, присутствует характерная рисовка, показаны штрихи и плавность в переходах. Также нейросеть смогла передать цветовую палитру и мягкий свет, присущие стилю. Однако присутствуют и неточности. Иногда ломается анатомия, некоторые объекты смазаны, прослеживается неровность контуров в некоторых изображениях. Возможно, если использовать исходные изображения разрешением 1024×1024, получится более точный результат.

Обучение нейросети стилю loish
8
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more