Китайский интернет-гигант Alibaba Cloud представил новую модель искусственного интеллекта под названием QwQ-32B, которая, несмотря на сравнительно небольшое количество параметров, может конкурировать с гораздо более совершенными моделями конкурентов.
Пока неясно, как независимые тестировщики оценивают QwQ-32B; например, в рейтингах Chatbot Arena модель пока не представлена.
В отличие от многих других систем искусственного интеллекта (особенно из Америки и западных стран), QwQ-32B предоставляется как программное обеспечение с открытым исходным кодом по лицензии Apache 2.0. Это обеспечивает широкое использование и дальнейшее развитие сообществом и, конечно, напоминает стратегию DeepSeek, которая также выпустила R1 с открытым исходным кодом по лицензии MIT. Например, компания Perplexity быстро воспользовалась этой возможностью и интегрировала DeepSeek R1 в свое приложение.
Вскоре после ее выпуска Ollama и Groq реализовали поддержку модели, что означает, что теперь пользователи могут программировать ИИ-агенты с открытым исходным кодом и использовать модель в сторонних приложениях. Кроме того, инфраструктура Groq обеспечивает рекордную скорость вывода результатов.
Повышение эффективности QwQ-32B знаменует собой потенциальный прорыв в отрасли, где до сих пор наблюдалась тенденция к использованию все более крупных моделей. Вместо этого QwQ-32B использует подход, аналогичный DeepSeek R1, и показывает, что продуманные методы обучения могут быть столь же важны, как и само количество параметров, когда речь идет о производительности ИИ.
Однако новая модель имеет ограничения. Иногда может возникнуть рекурсивный цикл рассуждений, который влияет на эффективность. Она, как и китайская модель ИИ, подчиняется местным нормативным требованиям, которые могут ограничивать ответы на политически чувствительные темы.
Alibaba рассматривает этот релиз как «первый шаг». Релиз последовал за запуском Alibaba Qwen 2.5-Max в январе, который, по словам компании, превзошел конкурентов «почти по всем показателям». Влияние китайских моделей в индустрии ИИ сейчас настолько значительно, что их рассматривают как важный фактор глобальной конкуренции в области ИИ.