Original size 613x817

Обучение генеративной нейросети по иллюстрациям «У бабушки»

PROTECT STATUS: not protected

1. Идея

В этом проекте я решила обучить генеративную нейросеть Stable Diffusion в стиле моих работ, которые создавала на 1 курсе арт-практики. На коллаж было отображено как маленькая девочка воспринимает окружающий мир в деревне. С утра она ходит вслед за бабушкой и удивляется тому на сколько все большое.

big
Original size 1280x500
post

Цель обучить нейросеть рисовать сцены, выполненные в стиле бумажных аппликаций. Исходные изображения в формате А4, поэтому я решила кадрировать их на 2 части. В итоге получился dataset из 16 изображений.

Особенность стилистики:

  1. Простые, геометричные формы
  2. Крупный план
  3. 3 цвета: чёрный, серый, белый

2. Процесс обучения

0
  1. Загрузка библиотек Diffusers, DreamBooth.
  2. Создание локального названия local_dir = «./grandma/»
  3. Загрузка изображений в Google Colab с помощью внутренней функции. Проверка как код видит данные для этого просим показать 5 изображений
0

4. Загрузка модели BLIP, которая создаёт подписи к картинкам. 5. Создание путей к изображениям. 6. Выбираем токен для стиля и смотрим на результат.

Original size 1452x666

7. Очищаем память для экономии места. 8. Начинаем подготовку к обучению. Вызываем функцию accelerate. Далее проходим регистрации на Hugging Faces и создаём личный токен.

0

Самая важная часть — обучение модели. Добавляем все данные и ожидаем результатов. Мое обучение длилось около 40 минут.

3. Результаты обучения

«photo collage in GRANDMA style, city, table, cup of coffee»

Первые результаты обучения получились некачественными. В них нет четкости и простоты, генерации в хаосе. Для исправления я решила писать в промте одно дополнительное слово.

Обучение генеративной нейросети по иллюстрациям «У бабушки»
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more