В рамках проекта представлены сгенерированные портреты известных актёров, выполненные в художественном стиле французского художника-импрессиониста Клода Моне
Исходные изображения
Датасет изображений был собран из базы wikiart.org, после чего все изображения были автоматически приведены к единому формату при помощи Python-скрипта.

Серия готовых изображений
Используя полученную модель, были сгенерированы портреты известных актёров, таких как Крис Эванс, Марго Робби, Ченнинг Татум и другие:
Ченинг Татум
Крис Эванс
Дуэйн Джонсон
Дженнифер Лоуренс
Марго Робби
Мэттью МакКонахи
Миа Гот
Роберт Дауни-младший
Райан Рейнольдс
Скарлетт Йоханссон
Сэмюэл Л. Джексон
В результате мы получили серию портретов, объединяющих эстетику импрессионизма и современную поп-культуру. Известные актёры представлены в художественной манере Клода Моне, что создаёт необычное сочетание классической живописной традиции и современных медийных образов.
Благодаря тому, что нейросеть обучалась на картинах Клода Моне, итоговые изображения приобрели характерные черты импрессионизма: мягкие мазки кисти, светлую цветовую палитру и атмосферу живописной легкости.
Принцип работы кода
Для дообучения модели и генерации изображений использовалась нейросеть Stable Diffusion.
В качестве обучающего набора данных было собрано 37 изображений картин Клода Моне, которые были загружены в качестве датасета и подключены к рабочему блокноту. Далее была проведена проверка доступности GPU, а также установлены необходимые зависимости для корректной работы среды и запуска обучения. После этого датасет с изображениями картин Клода Моне был подключён к проекту.
Следующим этапом были подготовлены текстовые описания (промпты) для изображений, которые используются моделью в процессе обучения для связи визуальной информации с текстовыми характеристиками.
На заключительном этапе модель была дообучена с использованием метода LoRA, который позволяет эффективно адаптировать уже обученную модель Stable Diffusion под конкретный художественный стиль, в данном случае — стиль Клода Моне.
Использованные нейросети
— Stable Diffusion XL — BLIP (Bootstrapping Language-Image Pre-training) — Dreambooth + LoRA методик




