Stability AI выпустила Stable Diffusion XL, новую модель генерации изображений

Блоги

28 июл. 2023, 18:45 Fantoci

Новая модель SDXL 1.0 позволяет осуществлять генерацию изображений в высоком разрешении с помощью искусственного интеллекта, который может работать на вашем компьютере.

Задумывались ли вы когда-нибудь о том, как сложно создавать реалистичные изображения с помощью ваших и неограниченного воображения? Сейчас вы можете превратить простое текстовое описание в потрясающий визуальный шедевр. Благодаря лондонской компании Stability AI, специализирующейся на генеративном искусственном интеллекте с открытым исходным кодом, теперь вы можете сделать это с помощью новой более прогрессивной модели Stable Diffusion XL 1.0 (SDXL).

Stable Diffusion XL - это следующее поколение Stable Diffusion, модели преобразования текста в изображение, которую английская компания выпустила в августе 2022 года. В Stable Diffusion используется новая технология диффузии скрытых переменных, которая преобразует случайный шум в изображение путем применения последовательности шумоподавляющих автоэнкодеров. Эти автокодировщики управляются текстовой подсказкой, в которой указывается, какое изображение необходимо получить.

Stable Diffusion получила широкую известность благодаря своей способности создавать разнообразные и высококачественные изображения из любого текста, например, "синий дракон, дышащий огнем" или "сюрреалистическая картина леса". Эту нейросеть также используют в различных ситуациях, таких как восстановление старых изображений, семантический синтез сцен, суперразрешение и многое другое.

Новая версия позволяет генерировать очень реалистичные изображения.

Первые версии Stable Diffusion имели ряд ограничений, таких как максимальное разрешение изображений и вычислительные затраты на модель. Поэтому компания Stability AI решила усовершенствовать свою последнюю модель и создать Stable Diffusion XL, которая обладает рядом преимуществ по сравнению со своей предшественницей.

Во-первых, Stable Diffusion XL может генерировать изображения с более высоким разрешением, вплоть до 1024х1024 пикселей. Это означает, что изображения получаются более детальными и реалистичными, чем раньше. Разницу можно увидеть на примерах выше.

Во-вторых, Stable Diffusion XL работает эффективнее и быстрее, чем Stable Diffusion. Это происходит потому, что она работает в пространстве скрытых переменных мощных предобученных автоэнкодеров, а не напрямую в пространстве пикселей. Это снижает сложность и размер модели, облегчая ее обучение и работу на ограниченных вычислительных ресурсах.

В-третьих, Stable Diffusion XL более гибка и универсальна, чем Stable Diffusion. Она может обрабатывать любые виды входных данных, например, текст, рисунок, аудиозапись или другое изображение. Кроме того, в ней используются слои перекрестного внимания для лучшего согласования входного и выходного доменов. Это позволяет ей легко выполнять задачи как изменение общего стиля изображения или изображение-в-изображение.

Stable Diffusion XL сгенерировала вот такое чудо. Чем-то напоминает мастера Йода в детстве или Грогу из сериала Мандалорец.

Новая версия показывает большой прогресс в развитии нейросетей от компании Stability AI и в целом всех генеративных ИИ. Она демонстрирует потенциал моделей скрытой диффузии для синтеза изображений и открывает новые возможности для творческого самовыражения и инноваций.

Если вы хотите опробовать Stable Diffusion XL, вы можете бесплатно загрузить файлы модели с GitHub и запустить их локально на своей машине. Для доступа к модели в режиме онлайн можно также использовать премиум-инструмент Stability AI для создания изображений DreamStudio или приложения сторонних разработчиков, такие как Clipdrop или Lensa.

Stability AI стремится сделать свои модели с открытым исходным кодом доступными для всех. Компания считает, что это лучший способ стимулировать сотрудничество и прогресс в области искусственного интеллекта. Она также поощряет любителей и разработчиков дорабатывать свои модели и создавать пользовательские версии для конкретных областей или эстетики.

Ещё одни яркий пример возможностей Stable Diffusion XL.

Компания Stability AI является одной из лучших не только в области генерации изображений, но и в других областях генеративного ИИ, таких как язык, аудио, видео, 3D-контент, биотехнологии и др. Компания имеет несколько исследовательских центров по всему миру, в которых разрабатываются передовые открытые модели ИИ для различных приложений.

На удивление английская компания действительно дальновидная компания, которая формирует будущее искусственного интеллекта благодаря своему инновационному и открытому подходу. Если вам интересно узнать больше о компании или ее моделях, вы можете посетить ее сайт или следить за ней в социальных сетях.

#искусственный интеллект #нейросеть #stability ai #sdxl 1.0 #stable diffusion xl #генерирование изображений

Источник: arstechnica.com

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Популярные статьи