Original size 1140x1600

Обучение генеративной нейросети под стиль художника Сальвадора Дали

7

описание идеи

Нет, наверное, человека, который не слышал бы о Сальвадоре Дали — гении сюрреализма, чьи работы поражают воображение и бросают вызов реальности. Меня всегда завораживало, как Дали превращал обычные пейзажи в фантасмагорические миры, наполненные тающими часами, парящими скалами и бесконечными перспективами.

Особенно вдохновляет его умение искажать пространство, создавая атмосферу сна и подсознания. Именно поэтому для обучения нейросети я взяла за основу его самые знаменитые пейзажные работы — от «Постоянства памяти» до «Искушения святого Антония».

Целью проекта было — научить генеративную нейросеть воспроизводить стиль Дали, чтобы создавать новые сюрреалистичные пейзажи, сохраняя его фирменные черты: ирреальные формы, гипертрофированные перспективы и загадочную, почти гипнотическую атмосферу.

Для обучения использовались работы Дали с четко выраженными пейзажными элементами, чтобы нейросеть лучше уловила его уникальную манеру. Результатом должны были стать изображения, которые не просто копируют стиль, но и развивают его в новых, неожиданных направлениях.

исходные изображения

папка с изображениями

процесс обучения модели

Перед началом нужно было подготовить сетап: установить зависимости, библиотеки и датасет с изображениями.

0

Далее нужно было убедиться, что датасет загружен и отображается в коде. Следующий шаг — создание префикса — это позволяет нейросети запоминать стиль и обучаться, ориентируясь на указанные слова.

0

И теперь переходим к обучению модели. Выбранные параметры обусловлены оптимальным временем обучения и соответствием доступным вычислительным ресурсам Kaggle.

Original size 813x542

Потом переходим к загрузке обученной модели:

Данный код выполняет загрузку модели Stable Diffusion XL с пользовательским VAE и подключает обученные LoRA-веса (checkpoint-500) для генерации изображений. Затем модель переносится на GPU (cuda) для выполнения инференса.

Original size 1167x380
Original size 1217x163

пример промта

вес нейросети 0,5 / вес нейросети 1

Вес нейросети на первой полученной картинке 0,5, а на второй 1. Мне больше понравилось, как получилась первая картинка, так как она больше передаёт стиль, характер и особенность цветовой палитры, в которой писал свои работы Сальвадор Дали.

Поэтому дальнейшая генерация картинок производилась с весом 0,5.

итоговая серия созданных изображений

Изображения, полученные с помощью обученной модели

Изображения, полученные с помощью обученной модели

Original size 1024x1024

Изображение, полученное с помощью обученной модели

Особенно впечатляюще нейросеть передала фирменные визуальные парадоксы Дали: текучие, деформированные объекты, которые существуют вопреки всем законам физики; пространства, изгибающиеся под невидимым напряжением; и эту пронизывающую всё полотно сюрреалистичную тревогу, заставляющую зрителя сомневаться в реальности увиденного.

Изображения, полученные с помощью обученной модели

После генерации сюрреалистических пейзажей и местности, мне захотелось попробовать сгенерировать портреты, как они были бы написаны в стиле Дали.

Изображения, полученные с помощью обученной модели

Изображения, полученные с помощью обученной модели

Потом мне захотелось посмотреть, как бы выглядел натюрморт.

Original size 1024x1024

Изображение, полученное с помощью обученной модели

И в заключение после генерации пейзажей, портретов и натюрморта я решила попробовать сгенерировать, как бы нейросеть представила животных, выполненных в стиле Сальвадора.

Изображения, полученные с помощью обученной модели

итог

Анализ результатов обучения модели показал, что код действительно позволяет эффективно адаптировать генерацию изображений под заданный стиль.

Сравнивая оригинальные работы художника с полученными результатами, можно отметить, что модель успешно усвоила характерные черты стиля и воспроизводит их в новых изображениях. Это подтверждает, что обучение прошло успешно, и нейросеть способна генерировать контент в нужной эстетике.

список инструментов, использованных в проекте

Hugging Face — получение токена для обучения нейросети Stable Diffusion — обучение генеративной нейросети под свой стиль Kaggle — выполнение кода и генераций чат GPT — для написания промтов

файл с кодом

Обучение генеративной нейросети под стиль художника Сальвадора Дали
7
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more