
Компания OpenAI анонсировала новую функцию генерации изображений на базе модели GPT-4o, которая теперь станет стандартной для всех версий ChatGPT. Благодаря улучшенной мультимодальной архитектуре, пользователи могут создавать высококачественные изображения без необходимости выбирать отдельную модель, как это было с DALL-E.
GPT-4o отличается повышенной точностью в воспроизведении сложных элементов, таких как текст, логотипы и другие детали. Новая система генерирует изображения поэтапно — сверху вниз и слева направо, что позволяет отображать детали с большей четкостью. Улучшенная обработка текстовых элементов делает технологию особенно полезной для создания инфографики, постеров и иллюстраций.
Дополнительно пользователи теперь могут редактировать загруженные изображения, создавая новые варианты на основе имеющихся визуальных данных.
Несмотря на значительные улучшения, у модели сохраняются определенные ограничения:
Генерация изображений может занимать до одной минуты из-за повышенной детализации.
Длинные изображения (например, постеры) могут обрезаться слишком плотно в нижней части.
При недостаточном контексте в запросе модель может «додумывать» детали.
Воспроизведение сложных концепций с большим числом объектов может быть неточным.
Символы и мелкие детали могут отображаться искаженно.
Исправление отдельных ошибок (например, орфографических) не всегда проходит без побочных изменений изображения.
OpenAI активно работает над устранением этих недостатков и планирует улучшить качество генерации в ближайшие месяцы.
Система оснащена усиленными мерами безопасности, предотвращающими создание вредоносного контента, включая запрещенные изображения и манипуляции с фотографиями. Все изображения, созданные с помощью GPT-4o, будут содержать метаданные C2PA, обозначающие их как сгенерированные OpenAI.
Помимо генерации изображений, OpenAI анонсировала интеграцию веб-поиска в ChatGPT. Это позволит пользователям получать актуальные ответы со ссылками на проверенные источники. Функция уже доступна для подписчиков ChatGPT Plus и Team, а также постепенно внедряется для бесплатных аккаунтов.

