Архитектура MoE, rоличество параметров от 30 до 500 млрд.

Компания NVIDIA представила свои новейшие открытые большие языковые модели семейства Nemotron 3, сообщает Wccftech. В стартовый состав вошли три модели в размерах Nano, Super и Ultra на базе архитектуры Mixture-of-Experts (MoE).

Источник изображения: NVIDIA

Nemotron 3 Nano — это компактная рассуждающая модель с 30 миллиардами общих параметров и 3 миллиардами активных параметров. Модель предназначена для эффективного решения задач с чётко обозначенной целью.

Nemotron 3 Super — высокоточная рассуждающая модель с общим количеством параметров 100 миллиардов и количеством активных параметров 10 миллиардов. В первую очередь предназначена для многоагентного применения.

Nemotron 3 Ultra — самая большая рассуждающая модель из представленных — примерно 500 и 50 миллиардов общих и активных параметров соответственно. Может применяться для решения сложных задач, требующих глубоких логических рассуждений.

Nemotron 3 Nano доступна уже сегодня. Модель является наиболее экономичной с точки зрения вычислительных затрат и оптимизирована для решения таких задач, как отладка программного кода, составление кратких обзоров, создание ИИ-помощников и поиск информации. По сравнению с Nemotron 2 Nano, производительность вывода новой модели до 4 раз больше, а генерация токенов при рассуждениях сократилась до 60%. Контекстное окно — 1 миллион токенов.

Nemotron 3 Super превосходно справляется с задачами, требующими взаимодействия множества агентов для выполнения сложных задач с низкой задержкой. Nemotron 3 Ultra служит продвинутым механизмом логического мышления для рабочих процессов искусственного интеллекта, требующих глубоких исследований и стратегического планирования.

Nemotron 3 Super и Ultra используют сверхэффективный 4-битный формат обучения NVFP4 от NVIDIA на архитектуре NVIDIA Blackwell, что значительно сокращает требования к памяти и ускоряет обучение. Эта эффективность позволяет обучать более крупные модели на существующей инфраструктуре без ущерба для точности.

NVIDIA Nemotron 3 Super и Ultra станут доступны в первой половине 2026 года.