Original size 1140x1600

Японские деревни через призму ИИ

PROTECT STATUS: not protected

(1) Идея проекта

Мне очень нравятся японские деревни и я подумала, а почему бы не обучить генеративную модель (Stable Diffusion с дообучением LoRA) по изображениям деревень в Японии?

Важно было, чтобы модель смогла передавать атмосферу этих деревень и их устройство, чтобы внешний вид соответствовал действительности, а не противоречил ей.

0

некоторые использованные мной фотографии в датасете

(2) Обучение модели

Для начала я проверяю состояние GPU.

Original size 1920x672

Дальше настраиваю среду импортируя некоторые библиотеки.

Original size 1920x173

Продолжаю настраивать среду до устанавливая библиотеку diffusers для работы с генеративными моделями, затем загружаю скрипт для обучения модели DreamBooth с LoRA, для настройки модели на личных данных.

Original size 1920x541

Перехожу к работе с датасетом. Загружаю картинки, найденные мной на фотостоке Unsplash по которым должна обучаться модель, а также проверяю, что картинки загрузились корректно.

Original size 1920x348
Original size 1920x926

Затем прописываю чтобы к картинкам автоматически генерировались подписи, при помощи модели BLIP. Он загружает изображения, обрабатывает их, генерирует подписи и сохраняет результаты в JSON-файл.

Original size 1920x817

Перед самим обучением также настраиваю конфигурацию для ускорения обучения моделей с помощью accelerate и захожу в аккаунт на платформе Hugging Face.

Начинаю процесс обучения LoRA устанавливая библиотеку datasets с моими картинками. После запускаю его, указывая определенные параметры: разрешение 512px, batch_size=2, lr=1e-4, 500 шагов с чекпоинтами через 250 и mixed_precision="fp16». Seed ставлю на 0.

Original size 1920x817

Сохраняю обученную модель на платформе Hugging Face для возможного дальнейшего использования.

Указываю, что модель будет работать с данными в формате float16, подключив обученную модель через stabilityai/stable-diffusion-xl-base-1.0. Настраиваю torch.float16 для всех компонентов.

Original size 1920x427

Теперь с обученной LoRA, приступаю к генерации изображений. Первые изображения я получила при использовании простого промта: japanese village scene, traditional houses, sakura trees, misty morning.

При генерации картинок буду использовать 25 шагов инференса, guidance_scale=7.5 и разрешение 1024×1024 для получения высокодетализированного результата.

Original size 1920x492

После тестовой генерации мне стало понятно, что в промте стоит писать более точное описание света и цветов, однако модель показала себя отлично и я приступила к генерации изображений.

(3) Генерация изображений

Original size 1920x492

(1) a realistic photo of japanese village, narrow alleyway lined with traditional wood-panelled houses, soft greyish-blue tones, dimly lit street lamps casting warm glow, serene evening ambiance

Original size 1920x492

(2) a realistic photo of japanese village, well-manicured flower garden surrounding modest teahouse, abundant clusters of peonies, azaleas, and camellias in full bloom, bright spring sun highlighting petals' intricate details

Original size 1920x492

(3) a realistic photo of japanese village, narrow street with low-hanging willow branches, soft golden sunlight filtering through delicate green foliage, white stucco walls of traditional houses subtly highlighted by scattered patches of light, overall color palette leaning toward calmer hues of olive, taupe, and cream, evoking a sense of serenity and harmony

Original size 1920x492

(4) a realistic photo of japanese village, narrow alleyway lined with traditional wood-panelled houses, soft greyish-blue tones, dimly lit street lamps casting warm glow, serene evening ambiance

Original size 1920x492

(5) a realistic photo of japanese village, wet cobblestone path winding through lush vegetation, iconic vermilion-colored torii gate standing prominently amidst thick evergreen shrubbery, soft silvery drizzle falling onto reflective puddles, gloomy cloud cover diffusing weak daylight into subdued, melancholic tones, colors blending harmoniously across spectrum of cool grays, darkened greens, and subtle hints of deep crimson (6) a realistic photo of japanese village, traditional wooden houses huddled together on sloped hillside facing iconic Mount Fuji, gentle rainfall cascading onto moss-covered stone paths and dripping from eaves of antique architecture, moody overcast sky enveloping the region in a layer of silvery-gray, atmospheric moisture saturating the air and causing everything to appear soft-focus and slightly blurred, vivid contrasts between darker charcoal tones of the mountainous backdrop and lighter steely blues of surroundings, culminating in a visually captivating and emotionally resonant depiction of Japanese country life during inclement weather (7) a realistic photo of japanese village, traditional wooden houses huddled together on sloped hillside facing iconic Mount Fuji, gentle rainfall cascading onto moss-covered stone paths and dripping from eaves of antique architecture, prominent vermilion-red torii gates marking entrance to sacred shrine nearby, moody overcast sky enveloping the region

(8) a realistic photo of japanese village, narrow alleyway bordered by charming traditional houses with vintage wooden facades, occasional parked cars and bicycles leaning against fences, subtle raindrops glistening on pavement and car windows, hushed silence interrupted only by occasional bird song, muted color palette dominated by varying shades of gray, beige, and dusty rose, capturing essence of serene daily life within tranquil village environment

Original size 1920x492
Японские деревни через призму ИИ
Project created at 11.02.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more