Платим блогерам
Блоги
Блогер
Выросла эффективность расхода токенов и уменьшено количество ошибок в рассуждениях

Компания OpenAI в четверг выпустила на рынок базовую модель GPT-5.4, которую она описывает как наиболее быструю и эффективную. Кроме стандартной, эта модель доступна в виде версии высокой производительности GPT-5.4 Pro и модели для рассуждений GPT-5.4 Thinking.

Pro представлена с контекстными окнами размером до 1 млн токенов, что станет рекордом для компании. Разработчики указали на повышенную эффективность расхода токенов. Это означает, решение задач будет расходовать меньше прежнего токенов.

Результаты в бенчмарках выросли, в том числе они рекордные в OSWorld-Verified и WebArena Verified. Рекорд поставлен и в тесте OpenAI GDPval для интеллектуальных задач, а именно 83%.

В APEX-Agents GPT-5.4 лидирует. Этот бенчмарк от Mercor создан для анализа профессиональных навыков в сфере права и финансов. Это означает, что GPT-5.4 умеет качественно создавать презентации, строить финансовые модели и проводить юридический анализ.

Изображение: Gemini

Также OpenAI обещает на треть уменьшить количество ошибок по сравнению с GPT-5.2. Общая вероятность ошибок в ответах уменьшена на 14%.

Был переработан способ управления вызовом инструментов в API версии GPT-5.4. Теперь используется система под названием «Поиск инструментов». Раньше система выдавала определения всех доступных инструментов, когда происходил вызов модели. Это могло расходовать много токенов, особенно по мере роста количества доступных инструментов. Теперь модели могут искать определения инструментов только при необходимости, что делает процесс более быстрым и дешёвым.

Ещё в новой версии появилась новая оценка безопасности при проверке цепочки рассуждений моделей. Это комментарии, которые модели дают для показа мыслительного процесса при выполнении многоэтапных задач. Теперь обман стал менее вероятен.

Источник: techcrunch.com
+
Написать комментарий (0)
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Сейчас обсуждают