Компания NVIDIA представила свои новейшие открытые большие языковые модели семейства Nemotron 3, сообщает Wccftech. В стартовый состав вошли три модели в размерах Nano, Super и Ultra на базе архитектуры Mixture-of-Experts (MoE).
Nemotron 3 Nano доступна уже сегодня. Модель является наиболее экономичной с точки зрения вычислительных затрат и оптимизирована для решения таких задач, как отладка программного кода, составление кратких обзоров, создание ИИ-помощников и поиск информации. По сравнению с Nemotron 2 Nano, производительность вывода новой модели до 4 раз больше, а генерация токенов при рассуждениях сократилась до 60%. Контекстное окно — 1 миллион токенов.
Nemotron 3 Super превосходно справляется с задачами, требующими взаимодействия множества агентов для выполнения сложных задач с низкой задержкой. Nemotron 3 Ultra служит продвинутым механизмом логического мышления для рабочих процессов искусственного интеллекта, требующих глубоких исследований и стратегического планирования.
Nemotron 3 Super и Ultra используют сверхэффективный 4-битный формат обучения NVFP4 от NVIDIA на архитектуре NVIDIA Blackwell, что значительно сокращает требования к памяти и ускоряет обучение. Эта эффективность позволяет обучать более крупные модели на существующей инфраструктуре без ущерба для точности.
NVIDIA Nemotron 3 Super и Ultra станут доступны в первой половине 2026 года.