Платим блогерам
Блоги
kosmos_news
Китайский техгигант Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.

Alibaba выпустила новую версию своего искусственного интеллекта. Под названием Qwen 3 представлено несколько так называемых гибридных моделей рассуждений с различными параметрами. То есть они способны как затрачивать больше времени для рассуждений, так и предоставлять быстрые ответы.


Может быть интересно

Всего несколько месяцев назад китайская компания Alibaba представила свою новую модель искусственного интеллекта Qwen 2.5. Компания хотела не только превзойти западные модели искусственного интеллекта, но и бросить вызов китайской Deepseek.

Под названием Qwen 3 первоначально будут выпущены шесть моделей ИИ. Три самые маленькие модели с размерами до четырех миллиардов параметров предлагают максимальную длину контекста в 32 000 токенов, тогда как более крупные модели предлагают максимум 128 000. (Токен — это последовательность текстовых символов.)

Все шесть моделей являются так называемыми моделями с открытым исходным кодом. Это означает, что Alibaba также предоставляет доступ к изученным параметрам. По данным Alibaba, все шесть моделей доступны для загрузки через Github и Hugging Face по лицензии Apache 2.0.

Qwen3-30B-A3B и Qwen3-235B-A22B также являются моделями с открытыми весами. Как следует из названия, первая модель имеет 30 миллиардов параметров, а вторая модель предлагает целых 235 миллиардов параметров. Длина контекста обеих моделей составляет максимум 128 000 токенов. 

Все модели Qwen 3 также способны к гибридному размышлению. Это значит, что они могут давать краткие ответы, а также дольше обдумывать подсказку и подвергать сомнению свой собственный ответ. Пользователи могут в любой момент выбрать, какой «бюджет на размышления» будет доступен Qwen 3. Например, чат-боту Qwen, работающему на базе Qwen3-235B-A22B, можно предоставить «бюджет мышления» от 1024 до 38 912 токенов. Чем больше бюджет, тем больше времени потребуется на ответ и тем он будет точнее.

Alibaba подчеркивает, что Qwen 3 обладает улучшенными навыками в качестве ИИ-агента по сравнению со своими предшественниками. Qwen 3 должен еще легче взаимодействовать с окружающей средой и использовать ее для предоставления ответов. Qwen 3 может получать доступ к каталогам на ПК. Например, пользователи могут поручить ИИ очистить папку с множеством отдельных файлов, создать содержательные подпапки и отсортировать в них все данные.

Все модели Qwen-3 поддерживают 119 языков и, как сообщается, были обучены с использованием набора данных, содержащего более 36 триллионов токенов. Один миллион токенов соответствует примерно 750 000 слов. Сообщается, что база данных включала книги, PDF-файлы, код и данные, сгенерированные искусственным интеллектом. Alibaba также проводит сравнения со своими западными и отечественными конкурентами.

Топовая модель Qwen3-235B-A22B достигает схожих значений с моделью OpenAI o1 во многих тестах и даже может превзойти конкурентов в некоторых тестах. По данным Alibaba, Qwen 3 работает даже лучше, чем Deepseek R1. ИИ показывает лучшие результаты во всех девяти представленных тестах. По результатам тестов Qwen 3 уступает только Google Gemini 2.5 Pro. Только в трех тестах новый ИИ смог достичь лучших результатов. Однако только при его использовании станет ясно, какую производительность обеспечивает Qwen 3 и в чем заключаются слабые стороны ИИ.

Источник: t.co
1
Показать комментарии (1)
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Сейчас обсуждают