

Примеры исходных изображений
В наше время все больше и больше людей окутывает техника, искусственный интеллект, роботы. Но что, если представить в буквальном смысле окутанных технологией людей. Серия изображений представляет одежду сделанную из разных элементов техники.

Фрагмент кода с промптом к изображению 1

Футуристическая куртка

Фрагмент кода с промптом к изображению 2

Платье
Фрагмент кода с промптом к изображению 3
Толстовка с капюшоном
Фрагмент кода с промптом к изображению 4
Авангардное платье
Фрагмент кода с промптом к изображению 5
Металлизированная ткань
Получились очень яркие образы в непривычной нам одежде
Фрагмент кода с промптом к изображению 6
Кроссовок
Фрагмент кода с промптом к изображению 7
Футуристическая броня
Фрагмент кода с промптом к изображению 8
Футуристическая куртка
Фрагмент кода с промптом к изображению 9
Футуристическая броня
Фрагмент кода с промптом к изображению 10
Костюм из светящихся цепей
Фрагмент кода с промптом к изображению 11
Платье
Фрагмент кода с промптом к изображению 12
Куртка
Как такое получилось:
На первом этапе была выполнена подготовка рабочего окружения: установлены необходимые библиотеки, включая Diffusers и DreamBooth. Затем тренировочные изображения были загружены из локальной файловой системы в среду Google Colab с помощью встроенного инструмента загрузки. Корректность загрузки данных была подтверждена их проверкой.
Фрагменты кода
Следующим этапом подготовки датасета стала генерация текстовых описаний для каждого изображения. Модель автоматически создала аннотации, которые точно соответствовали содержанию рисунков. Высокая точность распознавания подтвердила корректность работы алгоритма и пригодность загруженных изображений для последующего обучения.
Фрагменты кода
Следующим шагом была аутентификация в системе Hugging Face для доступа к моделям и хранения результатов. После этого начался процесс обучения модели со следующими параметрами:
- Разрешение: 512×512 пикселей - Максимальное количество шагов: 500 - Частота сохранения чекпоинтов: каждые 250 шагов
Оптимизация параметров позволила сократить время обучения до 30 минут без значительной потери в качестве.
Фрагмент кода
На финальном этапе обученная модель была сохранена в репозитории Hugging Face, после чего успешно протестирована в процессе генерации новых изображений.
Фрагменты кода
Благодаря тому, что нейросеть обучалась на четких, живых, ярких фотографиях, получилась очень качественная одежда, детализированная. На ней четко видны кабели, провода, какие-то технические элементы.