Alibaba заявляет, что её ИИ-модель превосходит решение от DeepSeek

По данным компании, это подкрепляется результатами таких тестов, как Arena-Hard, LiveBench, LiveCodeBench, MMLU и GPQA-Diamond.
30 января 2025, четверг 09:57
Zelikman для раздела Блоги

Китайская технологическая и торговая корпорация Alibaba Group Holding Ltd. представила свою последнюю модель искусственного интеллекта Qwen 2.5 Max, утверждая, что она превосходит Deepseek v3. 

Согласно информации от Alibaba, Qwen 2.5 Max обходит по производительности ведущие модели ИИ, разработанные Deepseek, OpenAI и Meta. Это громкое заявление прозвучало всего через три недели после долгожданного запуска Deepseek 10 января. Модель показала выдающиеся результаты в различных тестах, таких как Arena-Hard, LiveBench, LiveCodeBench, MMLU и GPQA-Diamond. Особенно стоит отметить, что ее результаты в MMLU и LiveCodeBench устанавливают новые стандарты в индустрии, подчёркивая её передовые технические возможности.

Появление Deepseek произвело фурор в Кремниевой долине, что привело к резкому падению акций технологических компаний и заставило конкурентов вновь сосредоточиться на демонстрации своих достижений в области искусственного интеллекта. В ответ на это неожиданное событие, компания ByteDance оперативно анонсировала усовершенствования своей модели ИИ, заявив, что она превзошла OpenAI o1 в тестах AIME.

Представление Qwen 2.5 Max отражает растущее давление внутри китайского технологического сектора по поддержанию конкурентоспособности перед иностранными игроками. Анонс состоялся 29 января 2025 года, в первый день Лунного Нового года, важного праздника, когда многие китайские компании временно закрываются. Это своевременное представление подчеркивает стремление Alibaba сохранить свои позиции в сфере ИИ, несмотря на усилившуюся конкуренцию со стороны Deepseek.

С учётом быстрого развития искусственного интеллекта, последний шаг Alibaba сигнализирует о новом этапе в глобальной гонке за лидерство в этой области.