Платим блогерам
Блоги
Alex040
Модель FLUX создаётся известной командой разработчиков и пытается бросить вызов платной Midjourney.

Здесь и далее – изображения с официального сайта FLUX, созданные, по утверждению авторов, моделью FLUX 1 Pro.

Ресурс Text to Image Leaderboard, разработанный командой ArtificialAnalysis, представил обновлённый рейтинг генераторов изображений, который неожиданно возглавил совершенно новый участник – модель FLUX 1 Pro.

Если верить рейтингу, то в слепом голосовании пользователей эта модель превосходит новейшую Midjourney v6.1, которая стала доступна полторы недели назад.

К такому результату, безусловно, следует относиться скептически, так как голосов за все новинки отдано ещё относительно немного.

Так сейчас выглядит рейтинг Text to Image Leaderboard от ArtificialAnalysis.

Чуть больше веры в результат добавляет команда разработчиков FLUX – Black Forest Labs. Её возглавляют бывшие инженеры, трудившиеся над Stable Diffusion и покинувшие Stability AI весной этого года.

Через несколько месяцев после их ухода Stability показала весьма спорную с точки зрения качества Stable Diffusion 3 Medium, которая оказалась неожиданно слабой в генерации картинок, содержащих людей. Stability пообещали всё исправить «в течение нескольких недель», но с тех пор прошло уже более месяца, а исправление пока так и не выпущено.

FLUX, как и Stable Diffusion, – модель с открытым исходным кодом. Она доступна в версиях Schnell, Dev и Pro. Schnell – самая быстрая, но и самая простая с точки зрения качества. Модель Pro, напротив, должна выдавать максимальное качество. Ну а Dev является сбалансированной версией, которая работает относительно быстро и выдаёт хорошую картинку.

Если верить рейтингу от ArtificialAnalysis, даже Dev-версия FLUX может держаться на равных с Midjourney 6.0. Midjourney, напомним, уже давно доступна исключительно платно.

В свою очередь, FLUX Schnell и Dev уже сейчас можно пробовать на различных сайтах. Собственно, авторы и сами предлагают бесплатно опробовать новинки на платформе Hugging Face. В разделе Spaces там изначально была доступна только версия Schnell, а сейчас к ней добавилась Dev. Позже, вероятно, можно ожидать и Pro.

В отличие от Stable Diffusion 3 у FLUX Dev нет чудовищных проблем с анатомией человека. Нейронка корректно рисует лица и фигуры, хотя пальцев на руках в некоторых генерациях всё ещё больше, чем нужно. Зато общее качество, освещение и композиция кадра кажутся если не лучшими среди всех, то, по крайней мере, одними из лучших.

FLUX также показалась сильнее большинства других генераторов в понимании сложных запросов, где, например, нужно нарисовать несколько разных объектов с заданными свойствами. У нейросети здесь всё далеко неидеально, но существенно лучше того, что доводилось видеть у конкурентов. Также FLUX сильна в написании текста на картинках, но, увы, лишь на английском.

Что касается рейтинга Text to Image Leaderboard от ArtificialAnalysis, то нетрудно заметить, что ТОП-5 там заняли версии FLUX и Midjourney. Впрочем, вскоре ситуация может измениться. Одним из самых сильных конкурентов может стать Playground 3.0. Её авторы обещают огромные изменения и «функции, которых в генераторах изображений ещё не было».

Также рейтинг по каким-то причинам не учитывает популярную нейросеть Ideogram, которая предложила весьма высокое качество ещё в начале года с версией 1.0 и вскоре может обновиться. Дополнительно рейтинг не покрывает многочисленные модификации Stable Diffusion, которые порой показывают сильные результаты (например, RealVisXL V4.0).

Наконец, нынешние лидеры также не собираются сидеть на месте. Midjourney обещают скорый релиз 6.2, а в перспективе выпуск 7.0, который, по словам разработчиков, будет более значимым, чем два предыдущих крупных обновления (5.0 и 6.0). В свою очередь, авторы FLUX на своём сайте также сообщают, что ещё только начали.

1
Показать комментарии (1)

Популярные новости

Сейчас обсуждают