Alibaba выпустила новую версию своего искусственного интеллекта. Под названием Qwen 3 представлено несколько так называемых гибридных моделей рассуждений с различными параметрами. То есть они способны как затрачивать больше времени для рассуждений, так и предоставлять быстрые ответы. 
Всего несколько месяцев назад китайская компания Alibaba представила свою новую модель искусственного интеллекта Qwen 2.5. Компания хотела не только превзойти западные модели искусственного интеллекта, но и бросить вызов китайской Deepseek.
Под названием Qwen 3 первоначально будут выпущены шесть моделей ИИ. Три самые маленькие модели с размерами до четырех миллиардов параметров предлагают максимальную длину контекста в 32 000 токенов, тогда как более крупные модели предлагают максимум 128 000. (Токен — это последовательность текстовых символов.)
Все шесть моделей являются так называемыми моделями с открытым исходным кодом. Это означает, что Alibaba также предоставляет доступ к изученным параметрам. По данным Alibaba, все шесть моделей доступны для загрузки через Github и Hugging Face по лицензии Apache 2.0.
Qwen3-30B-A3B и Qwen3-235B-A22B также являются моделями с открытыми весами. Как следует из названия, первая модель имеет 30 миллиардов параметров, а вторая модель предлагает целых 235 миллиардов параметров. Длина контекста обеих моделей составляет максимум 128 000 токенов.
Все модели Qwen 3 также способны к гибридному размышлению. Это значит, что они могут давать краткие ответы, а также дольше обдумывать подсказку и подвергать сомнению свой собственный ответ. Пользователи могут в любой момент выбрать, какой «бюджет на размышления» будет доступен Qwen 3. Например, чат-боту Qwen, работающему на базе Qwen3-235B-A22B, можно предоставить «бюджет мышления» от 1024 до 38 912 токенов. Чем больше бюджет, тем больше времени потребуется на ответ и тем он будет точнее.
Alibaba подчеркивает, что Qwen 3 обладает улучшенными навыками в качестве ИИ-агента по сравнению со своими предшественниками. Qwen 3 должен еще легче взаимодействовать с окружающей средой и использовать ее для предоставления ответов. Qwen 3 может получать доступ к каталогам на ПК. Например, пользователи могут поручить ИИ очистить папку с множеством отдельных файлов, создать содержательные подпапки и отсортировать в них все данные.
Все модели Qwen-3 поддерживают 119 языков и, как сообщается, были обучены с использованием набора данных, содержащего более 36 триллионов токенов. Один миллион токенов соответствует примерно 750 000 слов. Сообщается, что база данных включала книги, PDF-файлы, код и данные, сгенерированные искусственным интеллектом. Alibaba также проводит сравнения со своими западными и отечественными конкурентами.
Топовая модель Qwen3-235B-A22B достигает схожих значений с моделью OpenAI o1 во многих тестах и даже может превзойти конкурентов в некоторых тестах. По данным Alibaba, Qwen 3 работает даже лучше, чем Deepseek R1. ИИ показывает лучшие результаты во всех девяти представленных тестах. По результатам тестов Qwen 3 уступает только Google Gemini 2.5 Pro. Только в трех тестах новый ИИ смог достичь лучших результатов. Однако только при его использовании станет ясно, какую производительность обеспечивает Qwen 3 и в чем заключаются слабые стороны ИИ.

