Платформа визуальных коммуникаций Ideogram 2.0 запустила новый ИИ-инструмент и теперь стремится бросить вызов таким конкурентам, как Flux.1 и Midjourney. Инструмент создания изображений ИИ основан на модели freemium и и способен преобразовывать текст в изображения более точно, чем конкуренты.
Фото: Ideogram Ideogram хочет повысить общее качество своего инструмента обработки изображений с использованием искусственного интеллекта и реализовать новые функции. К ним относится улучшенный реализм. Стиль «Реалистичный» в Ideogram 2.0 предназначен для того, чтобы пользователи могли создавать изображения, похожие на настоящие фотографии.
«Текстуры были значительно улучшены, а человеческая кожа и волосы выглядят как настоящие», — говорится в официальном объявлении Ideogram.
Сообщается, что Ideogram 2.0 значительно превосходит другие модели преобразования текста в изображение по многим критериям качества, включая выравнивание изображения и текста, субъективные предпочтения и точность рендеринга текста.
Также появились четыре дополнительных стиля: «Общий», «Дизайн», «3D» и «Аниме». 
Пресет «Дизайн» предназначен для обеспечения точного и художественного графического вывода. С помощью длинных и стилизованных текстов Ideogram позволяет пользователям создавать графический дизайн для поздравительных открыток, плакатов, иллюстраций, а также маркетингового контента и контента для социальных сетей. С обновлением инструмент ИИ получил более точную цветовую палитру. В общем, инструмент будет не только быстрее и мощнее, но и универсальнее.
Канадский стартап в области искусственного интеллекта, базирующийся в Торонто, был основан в 2022 году четырьмя бывшими сотрудниками Google Мохаммадом Норузи, Читваном Сахарией, Уильямом Чаном и Джонатаном Хо. Запуск состоялся в 2023 году. Стартап принимал участие в различных научно-исследовательских проектах в Google, в частности в исследовательских проектах в области искусственного интеллекта. Опыт и знания специалистов в то время были использованы при разработке Ideogram. В конце августа прошлого года основатели получили $16,5 млн в рамках раунда начального финансирования.
Новая версия Ideogram была выпущена вскоре после того, как Flux.1 был интегрирован в инструмент искусственного интеллекта Grok. Grok-2, большая языковая модель (LLM), может подключаться к модели Flux.1 и генерировать изображения. Будучи основным генератором изображений в инструменте искусственного интеллекта Grok, он позиционирует себя как продвинутый инструмент создания изображений ИИ.
Другие модели с открытым исходным кодом, претендующие на лидерство в области создания изображений ИИ, включают Auraflow, KwaiKolors, Hunyuan, Lumina и Kandinsky 3. Конкуренция жесткая, но Ideogram была одной из первых моделей ИИ, появившихся наряду с менее известным инструментами. Deep Floyd IF компании Stability AI стала пионером в интеграции возможностей создания текста в модели изображений.

