Интернет гигант Alibaba выпустил ориентированную на рассуждения ИИ-модель QwQ-32

Китайская компания Alibaba представила ориентированную на рассуждения ИИ-модель QwQ-32. Она способна соперничать с передовыми решениями от конкурентов вроде DeepSeek-R1.
7 марта 2025, пятница 19:50
kosmos_news для раздела Блоги

Китайский интернет-гигант Alibaba Cloud представил новую модель искусственного интеллекта под названием QwQ-32B, которая, несмотря на сравнительно небольшое количество параметров, может конкурировать с гораздо более совершенными моделями конкурентов.


Модель, ориентированная на рассуждения, основана на базе Qwen2.5-32B от Alibaba и имеет всего 32,5 миллиарда параметров, но обеспечивает сопоставимую производительность с DeepSeek R1 с ее 671 миллиардом параметров. Модель QwQ-32B особенно эффективна в математических задачах и программирования. В ходе внутренних тестов производитель достиг следующих значений:
  •  65,2% в GPQA (тест на научное мышление на уровне выпускников)
  •  50% для AIME (высшая математика)
  •  90,6% в тесте MATH-500, который охватывает широкий спектр математических задач

Пока неясно, как независимые тестировщики оценивают QwQ-32B; например, в рейтингах Chatbot Arena модель пока не представлена.

В отличие от многих других систем искусственного интеллекта (особенно из Америки и западных стран), QwQ-32B предоставляется как программное обеспечение с открытым исходным кодом по лицензии Apache 2.0. Это обеспечивает широкое использование и дальнейшее развитие сообществом и, конечно, напоминает стратегию DeepSeek, которая также выпустила R1 с открытым исходным кодом по лицензии MIT. Например, компания Perplexity быстро воспользовалась этой возможностью и интегрировала DeepSeek R1 в свое приложение.

Вскоре после ее выпуска Ollama и Groq реализовали поддержку модели, что означает, что теперь пользователи могут программировать ИИ-агенты с открытым исходным кодом и использовать модель в сторонних приложениях. Кроме того, инфраструктура Groq обеспечивает рекордную скорость вывода результатов.

Повышение эффективности QwQ-32B знаменует собой потенциальный прорыв в отрасли, где до сих пор наблюдалась тенденция к использованию все более крупных моделей. Вместо этого QwQ-32B использует подход, аналогичный DeepSeek R1, и показывает, что продуманные методы обучения могут быть столь же важны, как и само количество параметров, когда речь идет о производительности ИИ.

Однако новая модель имеет ограничения. Иногда может возникнуть рекурсивный цикл рассуждений, который влияет на эффективность. Она, как и китайская модель ИИ, подчиняется местным нормативным требованиям, которые могут ограничивать ответы на политически чувствительные темы.

Alibaba рассматривает этот релиз как «первый шаг». Релиз последовал за запуском Alibaba Qwen 2.5-Max в январе, который, по словам компании, превзошел конкурентов «почти по всем показателям». Влияние китайских моделей в индустрии ИИ сейчас настолько значительно, что их рассматривают как важный фактор глобальной конкуренции в области ИИ.