Alibaba представила «гибридные» ИИ-модели Qwen3, «способные превзойти» решения от Google и OpenAI

Китайский техгигант Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.
30 апреля 2025, среда 13:21
kosmos_news для раздела Блоги

Alibaba выпустила новую версию своего искусственного интеллекта. Под названием Qwen 3 представлено несколько так называемых гибридных моделей рассуждений с различными параметрами. То есть они способны как затрачивать больше времени для рассуждений, так и предоставлять быстрые ответы.


Всего несколько месяцев назад китайская компания Alibaba представила свою новую модель искусственного интеллекта Qwen 2.5. Компания хотела не только превзойти западные модели искусственного интеллекта, но и бросить вызов китайской Deepseek.

Под названием Qwen 3 первоначально будут выпущены шесть моделей ИИ. Три самые маленькие модели с размерами до четырех миллиардов параметров предлагают максимальную длину контекста в 32 000 токенов, тогда как более крупные модели предлагают максимум 128 000. (Токен — это последовательность текстовых символов.)

Все шесть моделей являются так называемыми моделями с открытым исходным кодом. Это означает, что Alibaba также предоставляет доступ к изученным параметрам. По данным Alibaba, все шесть моделей доступны для загрузки через Github и Hugging Face по лицензии Apache 2.0.

Qwen3-30B-A3B и Qwen3-235B-A22B также являются моделями с открытыми весами. Как следует из названия, первая модель имеет 30 миллиардов параметров, а вторая модель предлагает целых 235 миллиардов параметров. Длина контекста обеих моделей составляет максимум 128 000 токенов. 

Все модели Qwen 3 также способны к гибридному размышлению. Это значит, что они могут давать краткие ответы, а также дольше обдумывать подсказку и подвергать сомнению свой собственный ответ. Пользователи могут в любой момент выбрать, какой «бюджет на размышления» будет доступен Qwen 3. Например, чат-боту Qwen, работающему на базе Qwen3-235B-A22B, можно предоставить «бюджет мышления» от 1024 до 38 912 токенов. Чем больше бюджет, тем больше времени потребуется на ответ и тем он будет точнее.

Alibaba подчеркивает, что Qwen 3 обладает улучшенными навыками в качестве ИИ-агента по сравнению со своими предшественниками. Qwen 3 должен еще легче взаимодействовать с окружающей средой и использовать ее для предоставления ответов. Qwen 3 может получать доступ к каталогам на ПК. Например, пользователи могут поручить ИИ очистить папку с множеством отдельных файлов, создать содержательные подпапки и отсортировать в них все данные.

Все модели Qwen-3 поддерживают 119 языков и, как сообщается, были обучены с использованием набора данных, содержащего более 36 триллионов токенов. Один миллион токенов соответствует примерно 750 000 слов. Сообщается, что база данных включала книги, PDF-файлы, код и данные, сгенерированные искусственным интеллектом. Alibaba также проводит сравнения со своими западными и отечественными конкурентами.

Топовая модель Qwen3-235B-A22B достигает схожих значений с моделью OpenAI o1 во многих тестах и даже может превзойти конкурентов в некоторых тестах. По данным Alibaba, Qwen 3 работает даже лучше, чем Deepseek R1. ИИ показывает лучшие результаты во всех девяти представленных тестах. По результатам тестов Qwen 3 уступает только Google Gemini 2.5 Pro. Только в трех тестах новый ИИ смог достичь лучших результатов. Однако только при его использовании станет ясно, какую производительность обеспечивает Qwen 3 и в чем заключаются слабые стороны ИИ.