
Идея
Я выбрал тему пустыни, потому что она максимально удалена от избыточности современного визуального мира. В пустыне нет ничего лишнего — только свет, песок и воздух. Хотелось проверить, способна ли нейросеть уловить это ощущение тишины и плотности пространства, где минимальные формы порождают максимальное чувство присутствия.
Пустыня была взята как одно из наиболее сложных задач с точки зрения анализа и генерации окружения. Сложность задачи обособлена большим количеством текстур, света и фактур из которых состоит это пространство.
База данных

Рабочая база данных
Для обучения использовался набор из 200 изображений пустынных пейзажей, включающих: панорамы дюн на закате, макросъёмки песчаных узоров, оазисы и караваны, ночные сцены с луной и звёздами
Этап 1 Результирующая серия изображений
После обучения была проведена генерация 20 финальных изображений с помощью Stable Diffusion v1.5 и подключённой LoRA-модификации. Использовались промпты, описывающие разные состояния пустыни: «a wide-angle shot of golden desert dunes under clear sky» «sunset view over a desert with glowing sand and shadows» «minimalistic desert scene with soft dunes and gentle light» «a caravan of camels crossing the desert» «desert oasis surrounded by palms and water reflections» «artistic oil painting of a desert with dunes and rocks» «vast desert under starry night sky» «wind creating flowing sand patterns on dunes» «dramatic desert cliffs at golden hour» «a lone wanderer in the middle of the desert»
4. Комментарий и анализ результата
LoRA уверенно передала структуру песчаной поверхности — мягкие гребни дюн, зернистость и контраст светотени. Цветовая палитра стабильно уходит в тёплые охристые и золотистые оттенки, иногда с лёгким пурпурным свечением на закатах. В ряде генераций появляется эффект тепловой дымки или рассеянного воздуха — то есть нейросеть научилась «читать» атмосферу пустыни, а не просто форму. Визуальные вариации: От минималистичных сцен с пустым горизонтом до многоплановых композиций с караванами. Различные состояния освещения — утро, полдень, вечер, ночь. Разница в стиле: реализм ↔ живописность (зависит от промпта).


Вывод
Проект «Desert LoRA» демонстрирует, как даже небольшой датасет может быть использован для формирования устойчивого художественного стиля при помощи адаптации LoRA. Полученные изображения показывают, что нейросеть способна «воспроизводить» не просто форму объекта, но и атмосферу пространства, если обучение выстроено на материальном восприятии света, цвета и текстуры.
В проекте дополнительно использовался ChatGPT (модель GPT-5) для: исправления грамматических и пунктуационных ошибок Все визуальные результаты (обучение и генерация) созданы исключительно средствами Stable Diffusion + LoRA