Original size 1140x1600

Обучение генеративной нейросети // AI Magic: The Winx Reboot

PROTECT STATUS: not protected
24

Концепция

Винкс стали культовым явлением, и 20-летие — это отличная возможность вернуть старых поклонников и привлечь новое поколение. Ребут позволит обновить знакомые истории и персонажей, сохранив при этом дух оригинала — где у каждой из фей есть уникальная стихия, которая в синтезе олицетворяет каждую из волшебниц. В 2025 году был выпущен сериал с новой графикой, которая была адаптирована на выпуск большого тиража серий. Из-за этого многие фанаты остались недовольными отсутствием прежнего стиля и «хрустальности» фей. С помощью технологии Stable Diffusion XL в сочетании с DreamBooth и LoRA я обучила нейросети на этом дата-сете. Это позволило мне создать изображения, которые не только соответствуют моему видению, но и сохраняют узнаваемые черты оригинальных персонажей и их магического мира. При выборе изображений для датасета, я искала работы 3d художников в таком стиле, где одновременно преобладают яркие, выраженные и хрупкие формы и черты лица, а также видимо представлен концепт волшебства. Датасет состоит из 100 изображений 512×512 пикселей.

Original size 1869x930

Исходные изображения для обучения ИИ (несколько примеров)

Описание применения генеративной модели

Благодаря обучению нейронных сетей я смогла изменить стиль и визуальные элементы, чтобы они соответствовали новым сюжетным линиям и персонажам, которые я создала. В итоге я получила изображения высокого качества, которые идеально передают концепцию моего проекта и могут быть использованы для дальнейшего продвижения и визуализации вселенной Винкс в новом свете.

Эти изображения стали основной частью моего проекта, помогая донести до аудитории обновлённый и современный взгляд на любимую вселенную, а также вдохновляя поклонников на новые приключения и истории.

Процесс генерации изображений

Для реализации проекта я выбрала платформу Kaggle, так как она предоставляет возможность использовать графические процессоры P100.

Перед началом работы потребовалось установить необходимые библиотеки и собрать обучающие данные.

Затем были загружены необходимые скрипты и изображения в формате датасета для последующего анализа.

0

На следующем этапе необходимо было проверить, что загруженный набор данных корректно отображается в коде. Затем мы создали префикс, чтобы нейронная сеть могла запомнить стиль и обучаться, опираясь на определённые слова.

Original size 1360x495
Original size 1408x599

Наконец, можно было начать обучение модели, которое заняло примерно 60 минут. После завершения обучения необходимо было применить созданный префикс для создания новых изображений в стиле, который был обучен.

Original size 770x489

В процессе генерации изображений было важно прописывать не только токен для присваивания изображению стиля обучения. В промпте также были указаны особенности феи, такие как цвет волос, стихия, волшебство и тд.

Original size 929x189
Original size 1088x512

Заимствование стиля в позе, глазах, волосах, в кадрировании изображения. Обучающий датасет (справа), полученное изображение (слева).

Чем более проработанный и детальней промпт, тем меньше результат становится похож на изначальный заданный обучением стиль.

Original size 1088x512

Заимствование стиля из датасета (фото справа) в сгенерированное изображение (фото слева)

Обращая внимание на заимствование стиля в созданные изображения, отчетливо видно сходство в прикрытых глазах, хрупких «фарфоровых лицах», а также в позах и выражении лиц.

Серия полученных изображений

Блум — фея пламени дракона

Original size 1024x1024

Текна — фея технологий

Original size 1024x1024

Стелла — фея солнца и луны

Original size 1024x1024

Муза — фея музыки

Original size 1024x1024

Лейла — фея воды и морфикса

Original size 1024x1024

Флора — фея природы

Original size 1024x1024

доп: Фоны в стилистике фей

Обучение генеративной нейросети // AI Magic: The Winx Reboot
24
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more