В конце декабря китайская лаборатория искусственного интеллекта DeepSeek представила мощную ИИ-модель . Сообщается, что за разработкой стоит китайский хедж-фонд High-Flyer Quant. Китайцы тогда утверждали, что их модель превосходит по производительности модели американских компаний, таких как OpenAI. Они также заявили, что ИИ был обучен на менее мощных чипах, а разработка стоила менее $6 млн что намного дешевле цены создания сопоставимых американских моделей.
Однако теперь была проведена серия независимых тестов производительности DeepSeek, сравнивающих производительность с Llama 3.1, GPT-4o от OpenAI и Claude Sonnet 3.5 от Anthropic. Выяснилось, что китайская модель может превзойти американскую в таких задачах, как решение сложных задач, арифметика и программирование, сообщает CNBC.
Кроме того, на этой неделе DeepSeek представила новую модель под названием r1, которая специализируется на логическом мышлении и также показала лучшие результаты, чем o1 от OpenAI в сравнительных тестах.
На Всемирном экономическом форуме в Давосе бизнес также обратил внимание на китайские разработки в сфере ИИ.
«Мы должны очень серьезно отнестись к этим событиям в Китае», — заявил глава Microsoft Сатья Наделла.
По его словам, новая модель DeepSeek действительно впечатляет, как с точки зрения эффективной реализации модели с открытым исходным кодом, которая обеспечивает оптимизированную по времени вычислений производительность, так и с точки зрения ее высокой эффективности.
В США специалисты все больше беспокоятся из-за китайских разработок в сфере ИИ. Возникает вопрос, сможет ли США сохранить мировое лидерство в области искусственного интеллекта. В США в разработку ИИ инвестируется гораздо больше денег.
Интересно, как китайской лаборатории удалось добиться столь выдающихся результатов при столь небольшом бюджете и несмотря на ограничения, накладываемые на поставку мощных чипов, необходимых для обучения ИИ, такие как Nvidia H100.
Одним из объяснений может быть то, что DeepSeek каким-то образом удалось обойти экспортные ограничения США. С другой стороны, возможно, исследователи использовали новые подходы к обучению ИИ, которые гораздо более эффективны и превосходят американские показатели.

