Платим блогерам
Блоги
Блогер
Модель расходует меньше токенов для достижения результатов как минимум не хуже прежних

Во вторник компания Anthropic анонсировала Claude Opus 4.5, ориентированную на программирование, агентов и использование компьютеров передовую модель ИИ. Компания уверяет, что это лучшая в мире модель программирования по результатам бенчмарка SWE-Bench Verified. Она значительно превосходит Sonnet 4.5 в других практических задачах, таких как глубокие исследования, редактирование слайдов и электронных таблиц.

Может быть интересно

Opus 4.5 набрала рекордные 80,9% в SWE-Bench Verified, опередив недавно выпущенные модели Gemini 3.0 и GPT-5.1-Codex-Max. При найме кандидатов на инженерные должности Anthropic предлагает сложный экзамен. Он также используется для тестирования новых моделей в качестве внутреннего бенчмарка. Компания рассказала, что Claude Opus 4.5 показал лучшие результаты, чем любой кандидат-человек, когда-либо справлявшийся с заданием за 2 часа.

Модель Opus 4.5 доступна во всех приложениях Claude, через API и на всех трёх основных облачных платформах (Azure, GCP и AWS). Anthropic снизила стоимость API Claude, делая модели уровня Opus доступными ещё большему числу пользователей.

Anthropic сделала модель эффективнее прежних. Claude Opus 4.5 использует значительно меньше токенов по сравнению с предшественниками, включая Opus 4.1, выдавая результаты не хуже или лучше. Модель использует меньше возвратов, избыточных исследований и сложных рассуждений. Opus 4.5 при среднем уровне сложности рассуждений может превзойти Sonnet 4.5, прошедший проверку SWE-Bench, используя на 76% меньше выходных токенов. При высоком уровне сложности рассуждений Opus 4.5 превосходит Sonnet 4.5 на 4,3%, используя на 48% меньше токенов.

API Claude даёт разработчикам возможность использовать параметр сложности рассуждений, который позволит выбирать скорость и мыслительные способности. С Opus 4.5 Claude Code может строить более точные планы и тщательнее выполнять их.

Источник: neowin.net
+
Написать комментарий (0)
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Сейчас обсуждают