Original size 1140x1600

Смешной котик

PROTECT STATUS: not protected
The project is taking part in the competition

Концепция

Мой проект начался с формулирования ключевого вопроса: может ли нейронная сеть научиться распознавать конкретного персонажа и затем создавать его изображения в различных ситуациях и визуальных сценариях.

Мне стало интересно исследовать возможности генеративных нейросетей не только как инструмента для создания изображений по текстовому описанию, но и как технологии, способной обучаться на примере одного объекта, запоминать его внешний вид и воспроизводить индивидуальные особенности. В качестве такого объекта я выбрал кота, что позволило на практике проверить, насколько точно модель сможет сохранить его узнаваемые черты и передать характерные детали.

Генерации

Серия изображений, полученных в результате обучения нейросети для генерации изображений на основе фотографий моего кота Арчи.

big
Original size 3152x1024

Промты: «photo in ARCHI style, one cat», «photo in ARCHI style, one cat next to computer», «photo in ARCHI style, one cat next to computer»

big
Original size 2088x1024

Промпты: «photo in ARCHI style, one cat», «photo in ARCHI style, one cat»

big
Original size 2088x1024

Промты: «photo in ARCHI style, one cat, on couch», «photo in ARCHI style, one cat, on couch»

Нейросети удалось успешно воспроизвести образ кота и создать несколько различных сюжетов с его участием. На полученных изображениях можно заметить отдельные характерные особенности моего кота, например его выразительные глаза, форму мордочки и особенности окраса, благодаря которым он остаётся узнаваемым в разных сценах.

Разумеется, полученные изображения пока нельзя назвать идеальными: в некоторых случаях заметны искажения анатомии, а также отдельные дефекты в проработке фона и деталей окружения.

Обучение

Обучения нейросети для генерации изображений:

  1. Сбор базы изображений
Original size 560x163

Загрузка изображений

  1. Загрузка базы данных в подходящем формате.

  2. Выбор архитектуры нейросети.

Original size 1303x440

Превью изображений

  1. Настройка параметров обучения (скорость обучения, функция потерь).

  2. Обучение генератора и дискриминатора.

Original size 627x433

Настройка нейронки перед обучением

  1. Визуальная оценка качества полученных изображений, корректировка, если требуется.
Original size 1706x145

Пример: промт и готовое изображение

Вывод

В рамках проекта мне удалось обучить нейросеть распознавать моего кота Арчи и генерировать новые изображения с его участием в разных ситуациях. Модель смогла сохранить его узнаваемые черты и частично передать особенности его поведения и характера. При этом в процессе работы стали заметны типичные ограничения генерации — ошибки в анатомии и деталях фона.

В целом цель проекта была достигнута: эксперимент показал, что даже на основе фотографий одного конкретного персонажа можно обучить нейросеть создавать новые сцены с ним и исследовать возможности персонализированной генерации изображений.

Для генерации промтов был использован ChatGPT.

Смешной котик
Project created at 24.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more