Я давно хотел попробовать генерацию изображений с помощью нейросетей. И вот недавно я нашёл очень простую инструкцию по установке нейронной сети Stable Diffusion.
Шаг 1. Проверяем минимальные системные требования компьютера, на который мы хотим установить программное обеспечение нейросети:
Windows 10/11 или Linux. Скоро появится экспериментальная поддержка Mac.
Видеокарта NVIDIA, желательно с 4 ГБ или более видеопамяти. Но если у вас нет совместимой видеокарты, вы все равно можете использовать ее с настройкой «Использовать ЦП». Это будет очень медленно, но все равно должно работать
Шаг 2. Скачиваем архив с программным обеспечением нейронной сети:
Шаг 3. Распаковываем скачанный архив в корень любого диска (это важно!). Далее для целей инструкции буду считать, что архив распаковали в корень диска С:\.
Шаг 4. Запускаем файл "Stable Diffusion UI.cmd" в каталоге C:\stable-diffusion-ui.
Это автоматически установит Stable Diffusion, настроит его и запустит интерфейс. Никаких дополнительных действий не требуется.
Дожидаемся окончания загрузки дополнительных пакетов программного обеспечения и настройки зависимостей.
Шаг 5. После завершения установки автоматически запустится браузер и откроет ссылку localhost:9000.
Всё - установка нейросети завершена.
Теперь необходимо скачать одну или несколько моделей для нейронной сети
Модели можно скачать, например, с сайта civitai.com
Я скачал себе следующие модели: Deliberate, DreamShaper, NeverEnding Dream (NED).
Скачанные модели размещаем в каталоге c:\stable-diffusion-ui\models\stable-diffusion\
Переходим в ранее открытую страницу браузера с адресом localhost:9000.
В поле "Model" выбираем скачанную модель (ниже на скриншоте выбрана модель "deliberate_v11"). Для других параметров можно выставить значения, аналогичные значениям на скриншоте ниже:
Можно начинать генерировать изображения.
В поле "Enter Prompt" вводим описание изображения на английском языке и нажимаем на кнопку "Make Image".
Время создания изображения зависит от множества параметров.
С видеокартой RTX 4090 время создания изображения с параметрами:
Sampler: dpm_solver_stability,
Inference Steps: 150,
Guidance Scale: 8.5,
Model: neverendingDreamNED_bakedVae,
VAE: vae-ft-mse-840000-ema-pruned,
Fix Faces: GFPGANv1.3
Image Size: 512x512
составляет от 26 до 37 секунд.
Примеры сгенерированных изображений:
1.
2.
3.
4.
5.
Спасибо за внимание!