NVIDIA продолжает развивать линейку своих открытых моделей, сделав ставку на скорость, эффективность и специализацию. Новое семейство Nemotron 3 предназначено для создания так называемых «агентных» систем ИИ, которые могут выполнять сложные последовательности задач.
Анонсированное семейство состоит из трех моделей, различающихся по размеру и назначению. Архитектура основана на смешанной модели экспертов (Mixture of Experts, MoE). Суть в том, что для каждой задачи активируется только часть параметров модели, что делает ее работу быстрее и экономичнее.
Nemotron 3 Nano — самая маленькая модель на 30 миллиардов параметров. Она уже доступна для загрузки. NVIDIA утверждает, что ее пропускная способность в 4 раза выше, чем у Nemotron 2 Nano. Эта версия подходит для целевых задач: отладки кода, создания кратких сводок или простых чат-ботов.
Nemotron 3 Super (100 млрд параметров) позиционируется как модель для рассуждений. Она должна лучше справляться с задачами, где требуется взаимодействие нескольких «агентов» ИИ.
Nemotron 3 Ultra (500 млрд параметров) задумана как мощный «движок» для сложной аналитики и стратегического планирования. Модели Super и Ultra станут доступны в первой половине 2026 года.

Ключевое преимущество новых моделей — эффективность. Они используют 4-битный формат NVFP4, что снижает требования к памяти и ускоряет обучение. Для бизнеса это означает возможность обучать более крупные модели на существующем оборудовании.
NVIDIA уже заручилась поддержкой ряда крупных компаний. Среди первых, кто начал внедрять Nemotron, — Accenture, Deloitte, Siemens, ServiceNow и Palantir. Модели планируют использовать в кибербезопасности, разработке ПО, медиа и телекоме.
Самую маленькую модель, Nemotron 3 Nano, можно найти на платформе Hugging Face, а также у ряда провайдеров вроде Together AI. Для корпоративных клиентов она будет доступна в виде микросервиса NVIDIA NIM, который можно развернуть на собственной инфраструктуре. Это дает компаниям больше контроля над данными и конфиденциальностью.

