
Концепция
Идея генерации собирательного образа советского агитплаката пришла мне в голову не сразу, но учитывая мою специализацию и то, как часто видеоигры затрагивают политическую тематику я решил создать алгоритм, который, хоть и не является заменой художникам и концепт-артистам, может попробовать передать компоновку и цели плаката для последующей доработки художником проекта.
В качестве основной тематики мною были взяты военные и иные агитационные плакаты первой половины XX века за их выразительность и четкое донесение мысли, которое, надеюсь, смог сохранить и мой алгоритм.
КОД (и он даже работает)
Первым этапом стал разгон производственных мощностей и сбор необходимых инструментов для создания алгоритма:

Создание датасета и директории:

Создаем массив с картинками…

Создание массива с картинками
Делаем токен и задаем caption
Подготовка к тренировочному процессу (здесь мне и пригодился токен от Huggingface)
Задаем параметры для тренировки, а именно разрешение изображения (512), количество этапов (250) и общее количество тренировочных шагов (500). Обучение начинается и займет примерно 50 минут…
Все почти готово…
Алгоритм готов к употреблению, в строке внизу можно вводить промпт и изображение будет сгенерировано!
Результат
Первый блин, конечно, пошел комом: Вот результат экспериментального промпта из лекции преподавателя, созданный для прогрева алгоритма: «photo collage in USSRWARPOSTER style, times square, new york»
«photo collage in USSRWARPOSTER style, a poster»
В результате работы алгоритма у меня получились изображения, отображающие несколько основнных тематик советского Агитпропа: Военная, Политическая, Индустриальная и Сельскохозяйственная. Сохранение живости и выразительности образов стало для меня основной задачей.
Промышленная и Сельскохозяйственная тематика
Промпт: «photo collage in USSRWARPOSTER style, agricultural poster»
дальнейшие промпты будут находиться в подписи к изображению
«photo collage in USSRWARPOSTER style, an agricultural poster»
«photo collage in USSRWARPOSTER style, a field of wheat»
«photo collage in USSRWARPOSTER style, industrial factory poster»
Политическая Агитация
Вот наиболее удачный вариант генерации политической агитации. Целью является сохранить чувство зова прямо к сердцу зрителя, активный призыв к действию и участию в жизни страны и следования коммунистическому строю.
«photo collage in USSRWARPOSTER style, Lenin adresses the crowd»
Военная Пропаганда
Переходим к военным постерам, стремясь сохранить эстетику:
«photo collage in USSRWARPOSTER style, soviet tanks rolling towards the enemy»
Основная задача: передать динамичность движений, и ощущение надежности, что должна внушать гражданину Советская Армия
«photo collage in USSRWARPOSTER style, a man armed with a rifle facing the viewer. There is no one else in the picture.»
«photo collage in USSRWARPOSTER style, soviet infantry assault»
Основной задачей было сохранить героичность и некую картинность позы, такой характерной для советского плакатного искусства.
«photo collage in USSRWARPOSTER style, a military poster»
Комментарий
В итоговой серии изображений представлен собирательный образ советского плаката первой половины XX века.
Удалось передать следующие элементы стиля: обилие красного цвета, ощущение грандиозности и мощи, выразительные позы.
Несмотря на ограниченность базы (50 изображений), удалось создать постеры на отличающиеся друг от друга тематики. На военных постерах танки, на сельскохозяйственном агитпропе довольный рабочий стоит у пшеничного поля, а на одном из политических плакатов получился вполне убедительный Ленин.
Подведение Итогов
Процесс создания алгоритма для генерации изображений был для меня трудным испытаниям, так как по специальности я больше отвечаю за саунд-дизайн и программирование мне известно лишь поверхностно, однако к концу процесса мне пришлось признать увлеченность процессом.
Это знание также поможет мне в моей будущей профессии дизайнера, ведь хоть оно и не заменит полноценного дизайнера, при должной настройке алгоритма можно существенно сэкономить время.
Ноутбук
Код Ноутбука для обучения расположен по следующей ссылке: https://www.kaggle.com/code/mogames/my-last-braincell
Прочее
Помимо самого генеративного алгоритма, иные нейросети (и генИИ) не были использованы для генерации ни идей, ни изображений.
Описание Применения Генеративной Модели
Были использованы следующие ресурсы:
https://huggingface.co/ для создания токена для обучения
[Stable Diffusion XL (SDXL)] для алгоритма создания изображений
https://stable-diffusion-book.vercel.app/en/train/DreamBooth/ для кастомизации диффузии
https://www.kaggle.com/code/mogames/my-last-braincell Kaggle как платформа для создания алгоритма