Original size 1039x1563

Обучение генеративной модели под стиль укиё-э

PROTECT STATUS: not protected

Концепция

Данный проект посвящён обучению Stable Diffusion и его применению для создания новых изображений. В качестве основы я решила использовать такое направление в искусстве как укиё-э и взять работы одного из художников этого направления — Утагава Куниёси.

Картины Утагава Куниёси

Для обучения использовался датасет из 35 картин. Ниже представлены некоторые из них.

Сгенерированные изображения

Сперва я решила сгенерировать то, что часто встречается среди работ в стиле укиё-э — пейзажи.

Сгенерированные изображения (комиксная версия)

После пейзажей я задумалась о том, насколько удачно модель могла бы осуществить различные необычные запросы и решила попробовать сгенерировать персонажей из комиксов.

Анализ изображений

Можно заметить, что в своих картинах Утагава в основном ставит людей на первый план, но, несмотря на это, при генерации пейзажей артефакты (случайные люди) возникали нечасто.

Все сгенерированные изображения не выбиваются из цветовой палитры, используемой в укиё-э. Так же сохраняется плоскость цветов и форм.

Original size 3639x1820

Тот самый артефакт

Не совсем удачно нейросеть справилась с рисованием цветов. На первый взгляд может показаться, что цветы получились хорошо, однако при приближении видно, что их форма повторяет форму листвы деревьев.

При этом в поданных на анализ работах есть «правильное» их изображение.

0

Сгенерированное изображение [1], картина Утагава Куниёси [2]

Существенно различаются лица сгенерированных персонажей от нарисованных художником.

Сгенерированное изображение [слева], картина Утагава Куниёси [справа]

Одежда в картинах японского художника всегда яркая и переполнена разнообразными узорами. В изображениях героев комикса можно заметить попытки нейросети сымитировать эти самые узоры.

0

Сгенерированное изображение [1], картина Утагава Куниёси [2]

Из-за специфики костюмов совсем аккуратно изобразить нейросеть их не смогла, однако персонажи всё равно хорошо читаются и узнаются.

Примечательно, что почти у всех персонажей присутствует катана, которая постоянно изображается у героев картин Утагава.

Сгенерированное изображение [слева], картина Утагава Куниёси [справа]

В целом, все сгенерированные работы соответствовали стилю, которому была обучена нейросетевая модель. Из-за отсутствия вспомогательных средств для улучшения конечного результата, а также из-за определённой сложности стиля Утагава Куниёси в изображениях всё же было достаточно недочётов (например, отсутствие или появление некоторых объектов, слияние персонажа с фоном и т. д.), но это было ожидаемо.

Процесс обучения генеративной модели

Перед началом работы обновляются все библиотеки, загружаются diffusers и обучающий скрипт с GITHUB.

Original size 1217x727

Далее загружается датасет с изображениями для дальнейшего обучения и проверяется правильность его отображения.

0

Следующий шаг — загрузка BLIP для создания подписей к изображениям.

Original size 1215x377
Original size 1214x144

Также добавляется идентификатор токена концепции к каждой подписи.

Original size 1215x201

Теперь нужно подготовить модель к обучению.

Сперва инициализируется accelerate, а затем вводится токен, созданный заранее на Hugging Face для записи обучающей модели.

Original size 1215x105
Original size 1216x72

После подготовки можно начать само обучение.

Для запуска процесса устанавливается библиотека datasets и запускается команда, в которой указаны нужные параметры для генерации изображений.

Original size 1213x652

Далее модель сохраняется на Hugging Face.

Original size 1215x146
Original size 1216x577

Финальный этап — непосредственно генерирование желаемых изображений. Для этого загружаются нужные модель и веса.

После остаётся только ввести промпт (запрос) и получить созданную картинку.

Original size 1216x281
Original size 1217x114

Ссылки на код и модель

Обучение генеративной модели под стиль укиё-э
Project created at 30.03.2025
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more