Как быстро начать создавать картинки с помощью нейросети Stable Diffusion

Устанавливаем нейросеть Stable Diffusion, скачиваем модели, генерируем изображения.
24 февраля 2023, пятница 23:31
RealMan для раздела Блоги

     Я давно хотел попробовать генерацию изображений с помощью нейросетей. И вот недавно я нашёл очень простую инструкцию по установке нейронной сети Stable Diffusion.

   Шаг 1. Проверяем минимальные системные требования компьютера, на который мы хотим установить программное обеспечение нейросети:

    Windows 10/11 или Linux. Скоро появится экспериментальная поддержка Mac.

    Видеокарта NVIDIA, желательно с 4 ГБ или более видеопамяти. Но если у вас нет совместимой видеокарты, вы все равно можете использовать ее с настройкой «Использовать ЦП». Это будет очень медленно, но все равно должно работать

    Шаг 2. Скачиваем архив с программным обеспечением нейронной сети:

    https://github.com/cmdr2/stable-diffusion-ui/releases/download/v2.5.15/stable-diffusion-ui-windows.zip

    Шаг 3. Распаковываем скачанный архив в корень любого диска (это важно!). Далее для целей инструкции буду считать, что архив распаковали в корень диска С:\.

    Шаг 4. Запускаем файл "Stable Diffusion UI.cmd" в каталоге C:\stable-diffusion-ui.

    Это автоматически установит Stable Diffusion, настроит его и запустит интерфейс. Никаких дополнительных действий не требуется.

 Дожидаемся окончания загрузки дополнительных пакетов программного обеспечения и настройки зависимостей.

    Шаг 5. После завершения установки автоматически запустится браузер и откроет ссылку localhost:9000.

    Всё - установка нейросети завершена.

    Теперь необходимо скачать одну или несколько моделей для нейронной сети

    Модели можно скачать, например, с сайта civitai.com

    Я скачал себе следующие модели: Deliberate, DreamShaper, NeverEnding Dream (NED).

    Скачанные модели размещаем в каталоге c:\stable-diffusion-ui\models\stable-diffusion\

    Переходим в ранее открытую страницу браузера с адресом localhost:9000.

    В поле "Model" выбираем скачанную модель (ниже на скриншоте выбрана модель "deliberate_v11"). Для других параметров можно выставить значения, аналогичные значениям на скриншоте ниже:

    Можно начинать генерировать изображения.

    В поле "Enter Prompt" вводим описание изображения на английском языке и нажимаем на кнопку "Make Image". 

    Время создания изображения зависит от множества параметров. 

    С видеокартой RTX 4090 время создания изображения с параметрами:

Sampler: dpm_solver_stability, 
Inference Steps: 150, 
Guidance Scale: 8.5, 
Model: neverendingDreamNED_bakedVae, 
VAE: vae-ft-mse-840000-ema-pruned, 
Fix Faces: GFPGANv1.3
Image Size: 512x512

составляет от 26 до 37 секунд.

Примеры сгенерированных изображений:

1.

Bear in boots, trousers, jacket, scarf, glovesSeed: 520552, Sampler: dpm_solver_stability, Inference Steps: 150, Guidance Scale: 8.5, Model: dreamshaper_331BakedVae, VAE: vae-ft-mse-840000-ema-pruned, Fix Faces: GFPGANv1.3
Processed 1 images in 26 seconds

2.

Starcraft II zergling eats humanSeed: 6525786, Sampler: dpm_solver_stability, Inference Steps: 200, Guidance Scale: 8.5, Model: dreamshaper_331BakedVae, VAE: vae-ft-mse-840000-ema-pruned, Fix Faces: GFPGANv1.3
Processed 1 images in 39 seconds

3.

Cat with wingsSeed: 8077416, Sampler: dpm_solver_stability, Inference Steps: 150, Guidance Scale: 8.5, Model: dreamshaper_331BakedVae, VAE: vae-ft-mse-840000-ema-pruned, Fix Faces: GFPGANv1.3
Processed 1 images in 31 seconds

4.

Fairy teddy bear catch jar of raspberry jam, Beautiful LightingSeed: 885573, Sampler: dpm_solver_stability, Inference Steps: 150, Guidance Scale: 8.5, Model: neverendingDreamNED_bakedVae, VAE: vae-ft-mse-840000-ema-pruned, Fix Faces: GFPGANv1.3
Processed 1 images in 28 seconds

5.

Спасибо за внимание!