Новая версия ИИ-генератора изображений Stable Diffusion создает мутантов вместо людей

Блоги

15 июн. 2024, 13:30 kosmos_news

Вместо того, чтобы генерировать более реалистичные изображения, искусственный интеллект буквально искажает людей.

Генератор изображений Stable Diffusion считается одним из лучших на рынке. Штаб-квартира Stability AI, стоящая за этим проектом, находится в Лондоне. Инструмент Stable Diffusion еще в прошлом году привел к судебным искам от художников и Getty Images. Они обвиняют британский стартап в том, что он обучил модели ИИ на защищенном от копирования контенте и тем самым допустил нарушение авторских прав. С помощью инструмента StableLM Stability AI также разработала большую языковую модель.

Из-за дальнейших разработок отличить изображения, созданные ИИ, от реальных фотографий становится все сложнее.

Компания Stability AI недавно выпустила свою последнюю модель Stable Diffusion 3 Medium. По их мнению, это должно стать «важной вехой в развитии генеративного ИИ».

Однако у модели, похоже, есть проблемы с правильным представлением людей. У людей на изображениях странности не только с количеством пальцев — распространенная проблема первых генераторов изображений ИИ. Целые части тела искажены.
Так выглядит созданная ИИ-генератором женщина, лежащая на лугу. Источник: fuzo
На платформе Reddit пользователи жалуются и спрашивают, не является ли публикация ИИ-модели шуткой. По сравнению с другими генераторами изображений ИИ, такими как Midjourney и DALL-E 3, последняя версия Stable Diffusion значительно хуже.
Именно так ИИ представляет позу йоги. Источник: fuzo
Конкуренты теперь могут даже генерировать нужное количество пальцев на одной руке. А вот у модели Stable Diffusion с этим большие проблемы.
Иногда ИИ генерирует слишком мало пальцев. Источник: fuzo
Иногда у людей получается слишком много пальцев. Источник: fuzo

Причина создания обезображенных людей также обсуждается на форумах Reddit. Если создать изображение без людей, оно, по крайней мере, будет выглядеть лучше, пусть даже иногда и имеет некоторые недостатки.

Пользователи подозревают, что причиной анатомических ошибок являются неправильно установленные фильтры. На самом деле фильтры предназначены для предотвращения создания контента для взрослых. Однако похоже, что изображения подвергнуты настолько жесткой цензуре, что все тело изменено.

Предыдущая модель Stable Diffusion 2.0 страдала от аналогичных проблем. Исследователи ИИ обнаружили, что слишком сильный фильтр наготы серьезно ухудшал способность ИИ генерировать анатомически правильных людей.

Примечательно, что почти год назад компания Stability AI, которая разработала ИИ-инструмент Stable Diffusion, выпустила новую версию генератора текста в изображение. Модель SDXL 0.9 изначально была доступна на рынке для исследовательских целей и, по словам разработчиков, предназначена для «создания гиперреалистичных картинок для фильмов, телевидения, музыки и обучающих видео» и поэтому является одним из пионеров изображений ИИ.

Модель SDXL 0.9 имеет 6,6 миллиарда параметров, что делает ее одной из самых больших в своем классе, но она по-прежнему должна работать на современном графическом процессоре. Для модели требуется только операционная система Windows 10 или 11 или Linux с 16 ГБ ОЗУ и графическая карта Nvidia GeForce RTX 20 (эквивалентная или более высокая стандартная) с не менее 8 ГБ видеопамяти. Пользователи Linux также могут использовать совместимую карту AMD с 16 ГБ видеопамяти.

Особенность, которую подчеркивает Stability AI: модель может рисовать реалистичные человеческие руки.

#технологии #искусственный интеллект #stable diffusion

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Популярные статьи

Популярные новости

Популярные статьи

Блог

Авторы

Статистика разгона

Закладки