СБЕР запустил нейросеть, которая создает изображения по текстовому описанию

Результат иногда удивляет, а иногда вводит в ступор, однако "поиграться" можно некоторое время.
4 ноября 2021, четверг 10:46
Ishem для раздела Блоги

Компания "СБЕР" разработала нейросеть, которая умеет генерировать изображения по текстовому описанию на русском языке. Разработчики говорят, что это может быть неплохим инструментом, для создания векторных изображений, рекламных банеров и прочего.

Несколько примеров:

"Серые котики"

"Красное короткое платье с декольте"

Изображение генерируется в три этапа: получение картинки из текста (собственно генерация), второй этап для определения наиболее подходящего среди сгенерированного и третий увеличивает в размере без потери качества.

Для тестирования нейросети можно использовать — ruDALL-E XL, которая насчитывает 1,3 млрд параметров, либоruDALL-E 12B,в которой уже 12 милиардов различных параметров.

"Неизвестная картина Босха"

Первый вариант доступен в браузере по ссылке, а также есть телеграмм-бот. Время генерации может сильно плавать, от пары минут, до часа, в зависимости от нагрузки.