
Концепция
Винкс стали культовым явлением, и 20-летие — это отличная возможность вернуть старых поклонников и привлечь новое поколение. Ребут позволит обновить знакомые истории и персонажей, сохранив при этом дух оригинала — где у каждой из фей есть уникальная стихия, которая в синтезе олицетворяет каждую из волшебниц. В 2025 году был выпущен сериал с новой графикой, которая была адаптирована на выпуск большого тиража серий. Из-за этого многие фанаты остались недовольными отсутствием прежнего стиля и «хрустальности» фей. С помощью технологии Stable Diffusion XL в сочетании с DreamBooth и LoRA я обучила нейросети на этом дата-сете. Это позволило мне создать изображения, которые не только соответствуют моему видению, но и сохраняют узнаваемые черты оригинальных персонажей и их магического мира. При выборе изображений для датасета, я искала работы 3d художников в таком стиле, где одновременно преобладают яркие, выраженные и хрупкие формы и черты лица, а также видимо представлен концепт волшебства. Датасет состоит из 100 изображений 512×512 пикселей.
Исходные изображения для обучения ИИ (несколько примеров)
Описание применения генеративной модели
Благодаря обучению нейронных сетей я смогла изменить стиль и визуальные элементы, чтобы они соответствовали новым сюжетным линиям и персонажам, которые я создала. В итоге я получила изображения высокого качества, которые идеально передают концепцию моего проекта и могут быть использованы для дальнейшего продвижения и визуализации вселенной Винкс в новом свете.
Эти изображения стали основной частью моего проекта, помогая донести до аудитории обновлённый и современный взгляд на любимую вселенную, а также вдохновляя поклонников на новые приключения и истории.
Процесс генерации изображений
Для реализации проекта я выбрала платформу Kaggle, так как она предоставляет возможность использовать графические процессоры P100.
Перед началом работы потребовалось установить необходимые библиотеки и собрать обучающие данные.
Затем были загружены необходимые скрипты и изображения в формате датасета для последующего анализа.
На следующем этапе необходимо было проверить, что загруженный набор данных корректно отображается в коде. Затем мы создали префикс, чтобы нейронная сеть могла запомнить стиль и обучаться, опираясь на определённые слова.
Наконец, можно было начать обучение модели, которое заняло примерно 60 минут. После завершения обучения необходимо было применить созданный префикс для создания новых изображений в стиле, который был обучен.
В процессе генерации изображений было важно прописывать не только токен для присваивания изображению стиля обучения. В промпте также были указаны особенности феи, такие как цвет волос, стихия, волшебство и тд.
Заимствование стиля в позе, глазах, волосах, в кадрировании изображения. Обучающий датасет (справа), полученное изображение (слева).
Чем более проработанный и детальней промпт, тем меньше результат становится похож на изначальный заданный обучением стиль.
Заимствование стиля из датасета (фото справа) в сгенерированное изображение (фото слева)
Обращая внимание на заимствование стиля в созданные изображения, отчетливо видно сходство в прикрытых глазах, хрупких «фарфоровых лицах», а также в позах и выражении лиц.
Серия полученных изображений
Блум — фея пламени дракона
Текна — фея технологий
Стелла — фея солнца и луны
Муза — фея музыки
Лейла — фея воды и морфикса
Флора — фея природы
доп: Фоны в стилистике фей