
Задумывались ли вы когда-нибудь о том, как сложно создавать реалистичные изображения с помощью ваших и неограниченного воображения? Сейчас вы можете превратить простое текстовое описание в потрясающий визуальный шедевр. Благодаря лондонской компании Stability AI, специализирующейся на генеративном искусственном интеллекте с открытым исходным кодом, теперь вы можете сделать это с помощью новой более прогрессивной модели Stable Diffusion XL 1.0 (SDXL).
Stable Diffusion XL - это следующее поколение Stable Diffusion, модели преобразования текста в изображение, которую английская компания выпустила в августе 2022 года. В Stable Diffusion используется новая технология диффузии скрытых переменных, которая преобразует случайный шум в изображение путем применения последовательности шумоподавляющих автоэнкодеров. Эти автокодировщики управляются текстовой подсказкой, в которой указывается, какое изображение необходимо получить.
Stable Diffusion получила широкую известность благодаря своей способности создавать разнообразные и высококачественные изображения из любого текста, например, "синий дракон, дышащий огнем" или "сюрреалистическая картина леса". Эту нейросеть также используют в различных ситуациях, таких как восстановление старых изображений, семантический синтез сцен, суперразрешение и многое другое.
Новая версия позволяет генерировать очень реалистичные изображения.
Первые версии Stable Diffusion имели ряд ограничений, таких как максимальное разрешение изображений и вычислительные затраты на модель. Поэтому компания Stability AI решила усовершенствовать свою последнюю модель и создать Stable Diffusion XL, которая обладает рядом преимуществ по сравнению со своей предшественницей.
Во-первых, Stable Diffusion XL может генерировать изображения с более высоким разрешением, вплоть до 1024х1024 пикселей. Это означает, что изображения получаются более детальными и реалистичными, чем раньше. Разницу можно увидеть на примерах выше.
Во-вторых, Stable Diffusion XL работает эффективнее и быстрее, чем Stable Diffusion. Это происходит потому, что она работает в пространстве скрытых переменных мощных предобученных автоэнкодеров, а не напрямую в пространстве пикселей. Это снижает сложность и размер модели, облегчая ее обучение и работу на ограниченных вычислительных ресурсах.
В-третьих, Stable Diffusion XL более гибка и универсальна, чем Stable Diffusion. Она может обрабатывать любые виды входных данных, например, текст, рисунок, аудиозапись или другое изображение. Кроме того, в ней используются слои перекрестного внимания для лучшего согласования входного и выходного доменов. Это позволяет ей легко выполнять задачи как изменение общего стиля изображения или изображение-в-изображение.
Stable Diffusion XL сгенерировала вот такое чудо. Чем-то напоминает мастера Йода в детстве или Грогу из сериала Мандалорец.
Новая версия показывает большой прогресс в развитии нейросетей от компании Stability AI и в целом всех генеративных ИИ. Она демонстрирует потенциал моделей скрытой диффузии для синтеза изображений и открывает новые возможности для творческого самовыражения и инноваций.
Если вы хотите опробовать Stable Diffusion XL, вы можете бесплатно загрузить файлы модели с GitHub и запустить их локально на своей машине. Для доступа к модели в режиме онлайн можно также использовать премиум-инструмент Stability AI для создания изображений DreamStudio или приложения сторонних разработчиков, такие как Clipdrop или Lensa.
Stability AI стремится сделать свои модели с открытым исходным кодом доступными для всех. Компания считает, что это лучший способ стимулировать сотрудничество и прогресс в области искусственного интеллекта. Она также поощряет любителей и разработчиков дорабатывать свои модели и создавать пользовательские версии для конкретных областей или эстетики.
Ещё одни яркий пример возможностей Stable Diffusion XL.
Компания Stability AI является одной из лучших не только в области генерации изображений, но и в других областях генеративного ИИ, таких как язык, аудио, видео, 3D-контент, биотехнологии и др. Компания имеет несколько исследовательских центров по всему миру, в которых разрабатываются передовые открытые модели ИИ для различных приложений.
На удивление английская компания действительно дальновидная компания, которая формирует будущее искусственного интеллекта благодаря своему инновационному и открытому подходу. Если вам интересно узнать больше о компании или ее моделях, вы можете посетить ее сайт или следить за ней в социальных сетях.

