Original size 1240x1750

Обучение генеративной нейросети

55

Идея проекта

Я несколько лет являюсь тату мастером, но проблемы с вдохновением при создании эскизов не позволяют мне выйти в полноценную работу на постоянной основе.

Поэтому я решила создать себе нейро-помощника, который будет быстро визуализировать для меня идеи.

Татуировки: 1. Неизвестный автор. 2. Миша Спокойный.

В качестве базы изображений для обучения я собрала татуировке в стиле, который мне нравится больше всего.

Я использовала как фотографии готовых работ, так и эскизы моего наставника в сфере тату: Миши Спокойного.

Эскизы Миши Спокойного.

Серия итоговых картин обученной модели

Животные. Изображения, сгенерированные обученной моделью.

1. Промпт: «photo of tattoo, a tattoo of a bat»

2. Пропмт: «photo of tattoo, a tattoo of a sheep with a bow»

Нейросеть хорошо справляется с короткими запросами и изображением животных, но в случае с овечкой не добавляет ей бантик. На мой взгляд удачнее вышло изображение летучей мыши, она выглядит нетривиально, а вот овечка гиперреалистична.

big
Original size 1024x1024

Гриб. Изображения, сгенерированные обученной моделью.

Флористика + предмет. Изображения, сгенерированные обученной моделью.

1. Промпт: «photo of tattoo, a tattoo of an open envelope with flowers sticking out of it»

2. Промпт: «photo of tattoo, a tattoo of a wood table with flowers in vase on it»

Обученная нейросеть достаточно хорошо справляется с комбинацией 2-ух элементов, но в случае генерации 3-ех элементов упорно игнорирует 3, как видно на 2-м изображении отсутствует стол.

Original size 1024x1024

Бабочка на цветах. Изображения, сгенерированные обученной моделью.

Ретро фотоаппарат и бабочки. Изображения, сгенерированные обученной моделью.

1. Промпт: «photo of tattoo, a tattoo of a retro camera»

2. Промпт: «photo of tattoo, a tattoo of a retro camera with a butterfly on it.»

Так же нейросеть хорошо справляется с добавлением небольших элементов вроде бабочек вокруг фотоаппарата.

Артефакты

Луна и черная кошка. Изображения, сгенерированные обученной моделью.

1. Промпт: «photo of tattoo, a moon»

2. Промпт: «photo of tattoo, a black cat»

Поскольку при обучении модели были использованы фото татуировок, у которых были не только реалистичные элементы, а сочетание разных стилей, нейросеть выдавала достаточно интересные и забавные артефакты.

Ножи и птица. Изображения, сгенерированные обученной моделью.

Нейросети оказалось сложнее всего генерировать изображение ножей, поэтому получились забавные картинки:

1. Нож-бабочка 2. Птица, в груди которой нож

Нейросеть против насилия.

Обучение модели

Вся работа по обучению модели была выполнена в Google Colab.

Первые шаги:

- импорт необходимых библиотек - импорт в colab датасета с собранными изображениями - проверка того, что датасет загружен.

Original size 1118x362

Скриншот с Google Colab.

После этого необходимо, чтобы нейросеть проанализировала все изображения, полученные из датасета и создала промпты, на которых в дальнейшем строиться обучение:

Промпт-префикс + промпт, полученный из анализа изображений.

Original size 1200x364

Скриншот с Google Colab.

Обучение модели длилось 43 минуты, после чего можно было приступать к генерации изображений.

Original size 677x327

Скриншот с Google Colab.

Промпт для обученной модели состоит из:

Префикс + новый запрос.

Префикс остается неизменным на протяжении всех генераций.

В моем случае это: «фотография татуировки, "

Original size 1478x831

Скриншот с Google Colab.

При генерации нейросеть выдавала слишком розовый фон и много артефактов, приходилось поднимать количество steps, а это занимало значительно больше времени на одну генерацию.

Я попробовала сделать чекпоинт, задающий силу смешивания, и в итоге нейросеть при меньшем количестве steps выдавала изображения, которые мне нужны были по стилистике.

Original size 635x180

Скриншот с Google Colab.

Original size 1414x785

Скриншот с Google Colab.

Вывод

Original size 1024x1024

Мотылек. Изображения, сгенерированные обученной моделью.

Обученная нейросеть по итогу отлично подходит для быстрой примерки идеи на кожу человека, что может значительно облегчить работу тату мастеров в данном стиле и быстро продемонстрировать клиенту возможные эскизы.

Данные идеи в любом случае будут требовать доработки, но для вдохновения отлично подходят.

Original size 1024x1024

Трамвай. Изображения, сгенерированные обученной моделью.

Обучение генеративной нейросети
55
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more