OpenAI запустила GPT-5.3-Codex-Spark на чипах Cerebras вместо NVIDIA

WCCFTech сообщает, что OpenAI задействовала оборудование Cerebras для работы своей новой модели GPT-5.3-Codex-Spark. Это первый случай масштабного использования альтернативных чипов для инференции ИИ за пределами инфраструктуры NVIDIA.
14 февраля 2026, суббота 18:17
Global_Chronicles для раздела Блоги

Рынок аппаратного обеспечения для искусственного интеллекта долгое время оставался вотчиной NVIDIA. Но ситуация начала меняться. В релизе новой модели Codex компания OpenAI раскрыла детали о вычислительной инфраструктуре. Как отмечает WCCFTech, помимо решений NVIDIA, в работе задействовали чипы Cerebras WSE-3.

Изображение - Prompt Engineering/youtube.com

Речь идет о версии GPT-5.3-Codex-Spark, которую OpenAI позиционирует как инструмент для работы в реальном времени. Разработчики заявляют о двукратном сокращении времени до получения первого токена — ключевого показателя для интерактивных задач. Такого результата добились за счет оптимизации конвейеров и, что важнее, использования архитектуры Cerebras.

OpenAI утверждает, что в этом релизе время до получения первого токена сократилось на 50%, что, безусловно, является впечатляющей цифрой. Именно поэтому с Codex-Spark OpenAI достигает 1000 транзакций в секунду, что, как утверждается, сравнимо с производительностью «парного программиста-человека».

Выбор в пользу Cerebras объясняется спецификой нагрузки. Инференция с низкой задержкой требует иного подхода, чем пакетная обработка, на которую заточены решения NVIDIA Blackwell. Использовать GPU NVIDIA для таких сценариев экономически невыгодно.

При этом в OpenAI подчеркивают: в вопросах масштабируемого вывода данных NVIDIA по-прежнему доминирует. Blackwell позволяет снижать стоимость токенов в разы, и основным партнером лаборатории остается именно NVIDIA.