
Описание проекта
В рамках данного проекта я обучил генеративную нейросеть Stable Diffusion на основе визуального материала из культового веб-сериала в жанре analog horror/VHS horror — The Mandela Catalogue.
Выбор именно этого сериала был обусловлен его уникальной визуальной эстетикой, атмосферой тревоги и искажения привычной реальности. Его выразительный язык VHS-записей, глитч-эффектов и мрачных, почти параноидальных образов идеально подходит для изучения и воссоздания характерной среды аналогового ужаса с помощью нейросетевых технологий.
Проект не только исследует границы синтетического изображения, но и отсылает к феномену коллективного страха в цифровую эпоху, где тревожное может прятаться за знакомыми экранами.
Примеры изображений


Созданные своим ИИ изображения
Разбор итоговой серии изображений
Что представлено в итоговой серии изображений
Нейросеть сгенерировала несколько образов, каждый из которых вдохновлён визуальным языком The Mandela Catalogue. В изображениях представлены:
- тревожные силуэты
- искажённые лица
- пустые интерьеры
- зловещие тени
- стилизованные под VHS/analog‑horror сцены
Все кадры выдержаны в едином тоне: приглушённая палитра с фиолетово-серыми оттенками и «плёночной» текстурой.
Связь с концепцией проекта
Образы чётко передают атмосферу The Mandela Catalogue:
- тревога на грани с паранойей
- неустойчивое чувство времени и пространства
- присутствие чего-то потустороннего, но неявного
- визуальные коды (телевизоры, силуэты в дверях, пустые углы)
Особенно хорошо отражены:
- эстетика «аналога» (шумы, цветовой дрифт, неестественная резкость);
- дух «инструктажей», где лица теряют человечность;
- тема двойников и альтернатив, как визуальный мотив искажения человеческой природы.
Разбор характеристик изображений
Сильные стороны:
- Изображения достаточно точно воспроизводят образы «альтернатив»: смазанные, тёмные, с акцентом на глаза/рот.
- Изображение с комнатой с лицом вдалеке успешно передает атмосферу, как будто «альтернатива» наблюдает из самого пространства.
- Изображение с телевизором в углу — великолепный символ тревожного наблюдения. Пустота и мрак за экраном говорят сами за себя.
Моменты, которые можно доработать:
- Изображения можно было бы чуть сильнее стилизовать, например добавлением визуального шума или глитчей/искажений
Обработка и технические детали
Для реализации проекта использовалась генеративная нейросеть Stable Diffusion XL (SDXL), дообученная с помощью методов DreamBooth и LoRA (Low-Rank Adaptation) в среде Google Colab с использованием GPU уровня T4.
DreamBooth позволил встроить в модель образы и стили конкретного визуального источника (The Mandela Catalogue) путём fine-tuning на небольшой кастомной выборке кадров из сериала.
LoRA обеспечил более эффективное дообучение за счёт замены полных весов на низкоранговые матрицы, что сократило требования к ресурсам и ускорило процесс.
Для оптимизации процесса применялись:
- Mixed precision training (fp16) — уменьшение потребления памяти без потери качества;
- Gradient checkpointing — для обработки больших batch size без превышения лимитов VRAM;
- AdamW 8-bit оптимизатор — для снижения нагрузки на GPU-память.
Генерация финальных изображений велась через pipeline diffusers, где обученные веса LoRA и DreamBooth были загружены в pre-trained SDXL. Результаты сохранялись в разрешении 1024×1024 пикселя.
Дополнительных стадий постобработки (например, апскейлинга или ретуши) не применялось — визуальные характеристики достигнуты исключительно за счёт fine-tuning модели и правильно настроенных промптов.
Визуальный анализ вариаций
Вариации охватывают три основные категории:
- Лица — крупный план, искажённые, с провалами в глазницах или ртах
- Интерьеры/комнаты — пустые сцены с тревожной атмосферой
- Силуэты/фигуры — тёмные фигуры на фоне
Все изображения визуально единообразны, но каждое предлагает свою вариацию страха: через пустоту, наблюдение или нечеловеческое искажение.
Итог
Генерации получились выразительными и стилистически выверенными. Проект достиг своей цели: обученная нейросеть смогла воссоздать эстетику analog horror и сформировать визуальный язык, отсылающий к The Mandela Catalogue без прямого копирования.
Дополнительные материалы (изображения ИИ на чекпоинте 250/500)