
описание идеи проекта
Цель проекта — обучить генеративную нейросеть Stable Diffusion на примере работ французского художника и гравёра Гюстава Доре. Его стиль отличается высокой детализацией, сложными теневыми переходами и драматической композицией. Обученная модель должна уметь генерировать изображения в его характерной манере.
Гюстав Доре (1832–1883) — французский художник, гравёр и иллюстратор, ставший знаменитым благодаря своим работам к классическим произведениям мировой литературы. Он начал карьеру очень рано, в 15 лет, и уже вскоре завоевал признание своими иллюстрациями.
Работы Доре отличаются: 1. Высокой детализацией — он прорисовывал каждую линию, создавая сложные текстуры и глубину.
2. Драматизмом и экспрессией — светотеневая игра придавала его работам мистическую и мощную атмосферу.
3. Динамичными композициями — он мастерски передавал движение и эмоциональное напряжение сцен.
4. Гравюрой техникой — благодаря использованию контраста и тонких линий его работы имели выразительный и запоминающийся стиль.
исходные изображения для обучения
Для обучения нейросети был собран датасет из 23 работ Гюстава Доре. Примеры исходных изображений:
ноутбук с кодом для обучения
В проекте использовался Google Colab для: Предобработки изображений (обрезка, изменение контраста, шумоподавление). Обучения модели с использованием DreamBooth и LoRA. Тестирования и генерации изображений после обучения.
результаты генерации
Ниже представлены несколько сгенерированных изображений, выполненных в стиле Гюстава Доре.
развёрнутый комментарий к итоговой серии изображений
В результате обучения нейросети в стиле Гюстава Доре удалось создать серию изображений, обладающих характерными элементами его художественной манеры.
Светотеневой баланс: Во всех изображениях прослеживается глубокая работа со светом и тенью, создающая эффект гравюры. Драматическая композиция: Изображения передают экспрессивность сцен, что соответствует стилю художника. Художественная перспектива: Во многих изображениях соблюдена классическая перспектива, характерная для гравюр XIX века. Разнообразие сцен: полученные изображения различаются по сюжетам и композиции, но объединены стилистическим единством.
разбор кода проекта
Ключевые этапы кода и их роль в проекте:
Проверка GPU (nvidia-smi) — определяет, есть ли доступ к графическому процессору. Установка зависимостей (pip install …) — загружает необходимые библиотеки для работы с моделями и Hugging Face. Загрузка изображений — создаётся папка для хранения данных (os.makedirs (local_dir, exist_ok=True)), и файлы загружаются через files.upload (). Создание подписей (captions) — используется модель BLIP, которая автоматически генерирует описания к изображениям. Настройка accelerate и авторизация на Hugging Face Hub — необходимо для работы с облачным хранилищем моделей. Обучение модели (accelerate launch train_dreambooth_lora_sdxl.py) — процесс адаптации модели Stable Diffusion под стиль Доре. Сохранение и загрузка модели на Hugging Face — результаты обучения загружаются в репозиторий (upload_folder (…)). Генерация изображений — обученная модель используется для создания новых картин в заданном стиле.
описание применения генеративной модели ГенИИ
Помимо Stable Diffusion, в проекте использовались другие инструменты:
ChatGPT — для написания экспликации и разборов результатов. ControlNet — для более точного контроля композиции. Gemini — построенная структура кода и рабочей среды в ноутбуке