Original size 699x978

Обучение генеративной нейросети под стиль Гюстав Доре

PROTECT STATUS: not protected

описание идеи проекта

Цель проекта — обучить генеративную нейросеть Stable Diffusion на примере работ французского художника и гравёра Гюстава Доре. Его стиль отличается высокой детализацией, сложными теневыми переходами и драматической композицией. Обученная модель должна уметь генерировать изображения в его характерной манере.

Гюстав Доре (1832–1883) — французский художник, гравёр и иллюстратор, ставший знаменитым благодаря своим работам к классическим произведениям мировой литературы. Он начал карьеру очень рано, в 15 лет, и уже вскоре завоевал признание своими иллюстрациями.

Работы Доре отличаются: 1. Высокой детализацией — он прорисовывал каждую линию, создавая сложные текстуры и глубину.

2. Драматизмом и экспрессией — светотеневая игра придавала его работам мистическую и мощную атмосферу.

3. Динамичными композициями — он мастерски передавал движение и эмоциональное напряжение сцен.

4. Гравюрой техникой — благодаря использованию контраста и тонких линий его работы имели выразительный и запоминающийся стиль.

исходные изображения для обучения

Для обучения нейросети был собран датасет из 23 работ Гюстава Доре. Примеры исходных изображений:

ноутбук с кодом для обучения

В проекте использовался Google Colab для: Предобработки изображений (обрезка, изменение контраста, шумоподавление). Обучения модели с использованием DreamBooth и LoRA. Тестирования и генерации изображений после обучения.

результаты генерации

Ниже представлены несколько сгенерированных изображений, выполненных в стиле Гюстава Доре.

a ghostly figure wandering through a graveyard, moonlight, shadows

развёрнутый комментарий к итоговой серии изображений

В результате обучения нейросети в стиле Гюстава Доре удалось создать серию изображений, обладающих характерными элементами его художественной манеры.

Светотеневой баланс: Во всех изображениях прослеживается глубокая работа со светом и тенью, создающая эффект гравюры. Драматическая композиция: Изображения передают экспрессивность сцен, что соответствует стилю художника. Художественная перспектива: Во многих изображениях соблюдена классическая перспектива, характерная для гравюр XIX века. Разнообразие сцен: полученные изображения различаются по сюжетам и композиции, но объединены стилистическим единством.

разбор кода проекта

Ключевые этапы кода и их роль в проекте:

Проверка GPU (nvidia-smi) — определяет, есть ли доступ к графическому процессору. Установка зависимостей (pip install …) — загружает необходимые библиотеки для работы с моделями и Hugging Face. Загрузка изображений — создаётся папка для хранения данных (os.makedirs (local_dir, exist_ok=True)), и файлы загружаются через files.upload (). Создание подписей (captions) — используется модель BLIP, которая автоматически генерирует описания к изображениям. Настройка accelerate и авторизация на Hugging Face Hub — необходимо для работы с облачным хранилищем моделей. Обучение модели (accelerate launch train_dreambooth_lora_sdxl.py) — процесс адаптации модели Stable Diffusion под стиль Доре. Сохранение и загрузка модели на Hugging Face — результаты обучения загружаются в репозиторий (upload_folder (…)). Генерация изображений — обученная модель используется для создания новых картин в заданном стиле.

описание применения генеративной модели ГенИИ

Помимо Stable Diffusion, в проекте использовались другие инструменты:

ChatGPT — для написания экспликации и разборов результатов. ControlNet — для более точного контроля композиции. Gemini — построенная структура кода и рабочей среды в ноутбуке

Обучение генеративной нейросети под стиль Гюстав Доре
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more