Original size 1039x1563

Обучение генеративной модели под стиль укиё-э

PROTECT STATUS: not protected
14

Концепция

Данный проект посвящён обучению Stable Diffusion и его применению для создания новых изображений. В качестве основы я решила использовать такое направление в искусстве как укиё-э и взять работы одного из художников этого направления — Утагава Куниёси.

Картины Утагава Куниёси

Для обучения использовался датасет из 35 картин. Ниже представлены некоторые из них.

Сгенерированные изображения

Сперва я решила сгенерировать то, что часто встречается среди работ в стиле укиё-э — пейзажи.

Сгенерированные изображения (комиксная версия)

После пейзажей я задумалась о том, насколько удачно модель могла бы осуществить различные необычные запросы и решила попробовать сгенерировать персонажей из комиксов.

Анализ изображений

Можно заметить, что в своих картинах Утагава в основном ставит людей на первый план, но, несмотря на это, при генерации пейзажей артефакты (случайные люди) возникали нечасто.

Все сгенерированные изображения не выбиваются из цветовой палитры, используемой в укиё-э. Так же сохраняется плоскость цветов и форм.

big
Original size 3639x1820

Тот самый артефакт

Не совсем удачно нейросеть справилась с рисованием цветов. На первый взгляд может показаться, что цветы получились хорошо, однако при приближении видно, что их форма повторяет форму листвы деревьев.

При этом в поданных на анализ работах есть «правильное» их изображение.

0

Сгенерированное изображение [1], картина Утагава Куниёси [2]

Существенно различаются лица сгенерированных персонажей от нарисованных художником.

Сгенерированное изображение [слева], картина Утагава Куниёси [справа]

Одежда в картинах японского художника всегда яркая и переполнена разнообразными узорами. В изображениях героев комикса можно заметить попытки нейросети сымитировать эти самые узоры.

0

Сгенерированное изображение [1], картина Утагава Куниёси [2]

Из-за специфики костюмов совсем аккуратно изобразить нейросеть их не смогла, однако персонажи всё равно хорошо читаются и узнаются.

Примечательно, что почти у всех персонажей присутствует катана, которая постоянно изображается у героев картин Утагава.

Сгенерированное изображение [слева], картина Утагава Куниёси [справа]

В целом, все сгенерированные работы соответствовали стилю, которому была обучена нейросетевая модель. Из-за отсутствия вспомогательных средств для улучшения конечного результата, а также из-за определённой сложности стиля Утагава Куниёси в изображениях всё же было достаточно недочётов (например, отсутствие или появление некоторых объектов, слияние персонажа с фоном и т. д.), но это было ожидаемо.

Процесс обучения генеративной модели

Перед началом работы обновляются все библиотеки, загружаются diffusers и обучающий скрипт с GITHUB.

Original size 1217x727

Далее загружается датасет с изображениями для дальнейшего обучения и проверяется правильность его отображения.

0

Следующий шаг — загрузка BLIP для создания подписей к изображениям.

Original size 1215x377
Original size 1214x144

Также добавляется идентификатор токена концепции к каждой подписи.

Original size 1215x201

Теперь нужно подготовить модель к обучению.

Сперва инициализируется accelerate, а затем вводится токен, созданный заранее на Hugging Face для записи обучающей модели.

Original size 1215x105
Original size 1216x72

После подготовки можно начать само обучение.

Для запуска процесса устанавливается библиотека datasets и запускается команда, в которой указаны нужные параметры для генерации изображений.

Original size 1213x652

Далее модель сохраняется на Hugging Face.

Original size 1215x146
Original size 1216x577

Финальный этап — непосредственно генерирование желаемых изображений. Для этого загружаются нужные модель и веса.

После остаётся только ввести промпт (запрос) и получить созданную картинку.

Original size 1216x281
Original size 1217x114

Ссылки на код и модель

Обучение генеративной модели под стиль укиё-э
14
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more