Выпуск новой ИИ-модели Deepseek R2 откладывается из-за проблем с обучением на чипах Huawei

Считалось, что ИИ-модель Deepseek станет ответом Китая на GPT-4.
14 августа 2025, четверг 23:07
kosmos_news для раздела Блоги

Пекинская компания Deepseek, занимающаяся разработкой технологий искусственного интеллекта, отложила на неопределённый срок выпуск своей новой модели R2. Как сообщают СМИ со ссылкой на Financial Times, причины кроются в технических проблемах, связанных с обучением модели исключительно на чипах китайской технологической компании Huawei. Этот случай демонстрирует сложные проблемы, с которыми сталкивается Китай в своём стремлении к технологической независимости от США.


После успешного выпуска модели Deepseek-R1 с открытым исходным кодом в январе китайские власти, как сообщает Financial Times (FT), рекомендовали компании использовать процессоры Huawei Ascend для следующей модели вместо лидирующих на рынке чипов Nvidia. Этот шаг был частью более масштабной национальной стратегии по снижению зависимости от западных технологий.

Согласно отчёту, трудности возникли в ходе самого ресурсоёмкого процесса: обучения модели. Именно на этом этапе ИИ изучает закономерности и взаимосвязи на основе огромных объёмов данных. Из-за постоянных технических проблем и нестабильности Deepseek была вынуждена вернуться к использованию проверенных, но нерекомендованных китайским правительством чипов Nvidia для обучения. 

Однако работа над совместимостью с чипами Huawei для так называемого выполнения вывода продолжается. В ходе вывода полностью обученная модель применяет свои знания для ответа на запросы. Этот процесс менее технически сложен, чем обучение. Тем не менее, этот случай показывает, что разрыв между политическими амбициями и технологической реальностью сохраняется, когда речь идёт о чипах ИИ.

Инсайдеры и аналитики отрасли давно отмечают, что китайские чипы ИИ пока не могут конкурировать с продуктами Nvidia по стабильности, программной экосистеме и критической скорости межчипового соединения. Недавний отчёт корпорации Rand подтверждает, что, несмотря на давление правительства, китайские технологические компании не спешат использовать чипы Huawei для обучения больших языковых моделей, поскольку их производительность уступает производительности Nvidia.

Согласно отчёту FT, сама Huawei направила в Deepseek команду инженеров для помощи. Основатель Deepseek Лян Вэньфэн, как сообщается, также выразил своё недовольство замедлением разработки R2.

Существуют также сообщения, подчёркивающие потенциал систем Huawei. Согласно тесту портала TechEDT, суперкомпьютерная система Huawei на базе чипов Ascend даже показала более высокую производительность, чем чип Nvidia H800, предназначенный для Китая, в специальном бенчмарке с использованием модели Deepseek R1. Это говорит о том, что Huawei пытается компенсировать недостатки отдельных чипов посредством масштабной оптимизации на системном уровне.

Для Deepseek эта задержка выпуска новой модели представляет собой отставание в гонке с сильными внутренними конкурентами, такими Alibaba (с её моделью Qwen). Этот случай наглядно демонстрирует, что разработка передового ИИ — это не только вопрос блестящих алгоритмов и огромных объёмов данных, но и фундаментальная зависимость от базового оборудования.