The Mandela Catalogue on Mediiia

Описание проекта

В рамках данного проекта я обучил генеративную нейросеть Stable Diffusion на основе визуального материала из культового веб-сериала в жанре analog horror/VHS horror — The Mandela Catalogue.

Выбор именно этого сериала был обусловлен его уникальной визуальной эстетикой, атмосферой тревоги и искажения привычной реальности. Его выразительный язык VHS-записей, глитч-эффектов и мрачных, почти параноидальных образов идеально подходит для изучения и воссоздания характерной среды аналогового ужаса с помощью нейросетевых технологий.

Проект не только исследует границы синтетического изображения, но и отсылает к феномену коллективного страха в цифровую эпоху, где тревожное может прятаться за знакомыми экранами.

Примеры изображений

Original size 1024x742

Original size 1280x720

Original size 1000x563

Original size 1203x856

Original size 758x1205

Original size 1209x1198

Original size 1495x1128

Созданные своим ИИ изображения

Original size 1024x1024

Разбор итоговой серии изображений

Что представлено в итоговой серии изображений

Нейросеть сгенерировала несколько образов, каждый из которых вдохновлён визуальным языком The Mandela Catalogue. В изображениях представлены:

— тревожные силуэты

— искажённые лица

— пустые интерьеры

— зловещие тени

— стилизованные под VHS/analog‑horror сцены

Все кадры выдержаны в едином тоне: приглушённая палитра с фиолетово-серыми оттенками и «плёночной» текстурой.

Связь с концепцией проекта

Образы чётко передают атмосферу The Mandela Catalogue:

— тревога на грани с паранойей

— неустойчивое чувство времени и пространства

— присутствие чего-то потустороннего, но неявного

— визуальные коды (телевизоры, силуэты в дверях, пустые углы)

Особенно хорошо отражены:

— эстетика «аналога» (шумы, цветовой дрифт, неестественная резкость);

— дух «инструктажей», где лица теряют человечность;

— тема двойников и альтернатив, как визуальный мотив искажения человеческой природы.

Разбор характеристик изображений

Сильные стороны:

— Изображения достаточно точно воспроизводят образы «альтернатив»: смазанные, тёмные, с акцентом на глаза/рот.

— Изображение с комнатой с лицом вдалеке успешно передает атмосферу, как будто «альтернатива» наблюдает из самого пространства.

— Изображение с телевизором в углу — великолепный символ тревожного наблюдения. Пустота и мрак за экраном говорят сами за себя.

Моменты, которые можно доработать:

— Изображения можно было бы чуть сильнее стилизовать, например добавлением визуального шума или глитчей/искажений

Обработка и технические детали

Для реализации проекта использовалась генеративная нейросеть Stable Diffusion XL (SDXL), дообученная с помощью методов DreamBooth и LoRA (Low-Rank Adaptation) в среде Google Colab с использованием GPU уровня T4.

DreamBooth позволил встроить в модель образы и стили конкретного визуального источника (The Mandela Catalogue) путём fine-tuning на небольшой кастомной выборке кадров из сериала.

LoRA обеспечил более эффективное дообучение за счёт замены полных весов на низкоранговые матрицы, что сократило требования к ресурсам и ускорило процесс.

Для оптимизации процесса применялись:

— Mixed precision training (fp16) — уменьшение потребления памяти без потери качества;

— Gradient checkpointing — для обработки больших batch size без превышения лимитов VRAM;

— AdamW 8-bit оптимизатор — для снижения нагрузки на GPU-память.

Генерация финальных изображений велась через pipeline diffusers, где обученные веса LoRA и DreamBooth были загружены в pre-trained SDXL. Результаты сохранялись в разрешении 1024×1024 пикселя.

Дополнительных стадий постобработки (например, апскейлинга или ретуши) не применялось — визуальные характеристики достигнуты исключительно за счёт fine-tuning модели и правильно настроенных промптов.

Визуальный анализ вариаций

Вариации охватывают три основные категории:

— Лица — крупный план, искажённые, с провалами в глазницах или ртах

— Интерьеры/комнаты — пустые сцены с тревожной атмосферой

— Силуэты/фигуры — тёмные фигуры на фоне

Все изображения визуально единообразны, но каждое предлагает свою вариацию страха: через пустоту, наблюдение или нечеловеческое искажение.

Итог

Генерации получились выразительными и стилистически выверенными. Проект достиг своей цели: обученная нейросеть смогла воссоздать эстетику analog horror и сформировать визуальный язык, отсылающий к The Mandela Catalogue без прямого копирования.

Google Collab

Дополнительные материалы (изображения ИИ на чекпоинте 250/500)

Original size 1024x1024