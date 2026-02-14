WCCFTech сообщает, что OpenAI задействовала оборудование Cerebras для работы своей новой модели GPT-5.3-Codex-Spark. Это первый случай масштабного использования альтернативных чипов для инференции ИИ за пределами инфраструктуры NVIDIA.

Рынок аппаратного обеспечения для искусственного интеллекта долгое время оставался вотчиной NVIDIA. Но ситуация начала меняться. В релизе новой модели Codex компания OpenAI раскрыла детали о вычислительной инфраструктуре. Как отмечает WCCFTech, помимо решений NVIDIA, в работе задействовали чипы Cerebras WSE-3.

Речь идет о версии GPT-5.3-Codex-Spark , которую OpenAI позиционирует как инструмент для работы в реальном времени. Разработчики заявляют о двукратном сокращении времени до получения первого токена — ключевого показателя для интерактивных задач. Такого результата добились за счет оптимизации конвейеров и, что важнее, использования архитектуры Cerebras.

OpenAI утверждает, что в этом релизе время до получения первого токена сократилось на 50%, что, безусловно, является впечатляющей цифрой. Именно поэтому с Codex-Spark OpenAI достигает 1000 транзакций в секунду, что, как утверждается, сравнимо с производительностью «парного программиста-человека».

Выбор в пользу Cerebras объясняется спецификой нагрузки. Инференция с низкой задержкой требует иного подхода, чем пакетная обработка, на которую заточены решения NVIDIA Blackwell. Использовать GPU NVIDIA для таких сценариев экономически невыгодно.

При этом в OpenAI подчеркивают: в вопросах масштабируемого вывода данных NVIDIA по-прежнему доминирует. Blackwell позволяет снижать стоимость токенов в разы, и основным партнером лаборатории остается именно NVIDIA.