Mediiia

В рамках проекта представлены сгенерированные портреты известных актёров, выполненные в художественном стиле французского художника-импрессиониста Клода Моне

Исходные изображения

Датасет изображений был собран из базы wikiart.org, после чего все изображения были автоматически приведены к единому формату при помощи Python-скрипта.

Исходный размер 620x961

Исходный размер 846x816

Исходный размер 592x800

Серия готовых изображений

Используя полученную модель, были сгенерированы портреты известных актёров, таких как Крис Эванс, Марго Робби, Ченнинг Татум и другие:

Ченинг Татум

Крис Эванс

Дуэйн Джонсон

Дженнифер Лоуренс

Марго Робби

Мэттью МакКонахи

Миа Гот

Роберт Дауни-младший

Райан Рейнольдс

Скарлетт Йоханссон

Сэмюэл Л. Джексон

В результате мы получили серию портретов, объединяющих эстетику импрессионизма и современную поп-культуру. Известные актёры представлены в художественной манере Клода Моне, что создаёт необычное сочетание классической живописной традиции и современных медийных образов.

Благодаря тому, что нейросеть обучалась на картинах Клода Моне, итоговые изображения приобрели характерные черты импрессионизма: мягкие мазки кисти, светлую цветовую палитру и атмосферу живописной легкости.

Принцип работы кода

Для дообучения модели и генерации изображений использовалась нейросеть Stable Diffusion.

В качестве обучающего набора данных было собрано 37 изображений картин Клода Моне, которые были загружены в качестве датасета и подключены к рабочему блокноту. Далее была проведена проверка доступности GPU, а также установлены необходимые зависимости для корректной работы среды и запуска обучения. После этого датасет с изображениями картин Клода Моне был подключён к проекту.

Следующим этапом были подготовлены текстовые описания (промпты) для изображений, которые используются моделью в процессе обучения для связи визуальной информации с текстовыми характеристиками.

На заключительном этапе модель была дообучена с использованием метода LoRA, который позволяет эффективно адаптировать уже обученную модель Stable Diffusion под конкретный художественный стиль, в данном случае — стиль Клода Моне.

Использованные нейросети

— Stable Diffusion XL — BLIP (Bootstrapping Language-Image Pre-training) — Dreambooth + LoRA методик

Блокнот

актеры в стиле Клод Моне