Moleculo
NVIDIA представила открытые языковые модели Nemotron 3 Nano, Super и Ultra
Архитектура MoE, rоличество параметров от 30 до 500 млрд.

Компания NVIDIA представила свои новейшие открытые большие языковые модели семейства Nemotron 3, сообщает Wccftech. В стартовый состав вошли три модели в размерах Nano, Super и Ultra на базе архитектуры Mixture-of-Experts (MoE).

Источник изображения: NVIDIA

  • Nemotron 3 Nano — это компактная рассуждающая модель с 30 миллиардами общих параметров и 3 миллиардами активных параметров. Модель предназначена для эффективного решения задач с чётко обозначенной целью.
  • Nemotron 3 Super — высокоточная рассуждающая модель с общим количеством параметров 100 миллиардов и количеством активных параметров 10 миллиардов. В первую очередь предназначена для многоагентного применения.
  • Nemotron 3 Ultra — самая большая рассуждающая модель из представленных — примерно 500 и 50 миллиардов общих и активных параметров соответственно. Может применяться для решения сложных задач, требующих глубоких логических рассуждений.

Nemotron 3 Nano доступна уже сегодня. Модель является наиболее экономичной с точки зрения вычислительных затрат и оптимизирована для решения таких задач, как отладка программного кода, составление кратких обзоров, создание ИИ-помощников и поиск информации. По сравнению с Nemotron 2 Nano, производительность вывода новой модели до 4 раз больше, а генерация токенов при рассуждениях сократилась до 60%. Контекстное окно — 1 миллион токенов.

Nemotron 3 Super превосходно справляется с задачами, требующими взаимодействия множества агентов для выполнения сложных задач с низкой задержкой. Nemotron 3 Ultra служит продвинутым механизмом логического мышления для рабочих процессов искусственного интеллекта, требующих глубоких исследований и стратегического планирования.

Nemotron 3 Super и Ultra используют сверхэффективный 4-битный формат обучения NVFP4 от NVIDIA на архитектуре NVIDIA Blackwell, что значительно сокращает требования к памяти и ускоряет обучение. Эта эффективность позволяет обучать более крупные модели на существующей инфраструктуре без ущерба для точности.

NVIDIA Nemotron 3 Super и Ultra станут доступны в первой половине 2026 года.

#nvidia #искусственный интеллект #nemotron 3
Источник: wccftech.com
Сейчас обсуждают

TM1
19:44
для третьей версии требуется карта 18-24 ГБ видеопамяти. Тренировать дома на 8 ГБ можно вторую версию. Вживую третью версию попробовать можно тут: https://build.nvidia.com/nvidia/nemotron-3-nano-30b...
NVIDIA представила открытые языковые модели Nemotron 3 Nano, Super и Ultra
Женя Ярошенко
19:04
Угарну, если по итогу майки своми триллионами триллионов вытянут подразделение, которое они (судя по последним событиям) не особо ценят)
Будущее Steam и PlayStation под вопросом — впереди самый сложный период для игровой индустрии
KAA
18:58
А что это за платка с гнусной турбиной? Расширение для SSD? Я в жизни такой источник неприятного шума не поставлю в свой системник. За такие деньки делайте либо пассивное охлаждение, либо хотя бы с д...
MSI выпустила ограниченный тираж материнских плат MEG X870E GODLIKE X Edition для платформы AMD AM5
_KVV
18:54
Если это будут террористы и экстремисты, то да, можете брать. За обычных, мирных, честных людей ничего не дают....
США смягчают санкции против Белоруссии после освобождения заключённых
Parlous
18:50
По моему скромному мнению вин11 ругают не заслуженно, хорошая система. Если немного пошаманить, но это относится к любой OS.
Моя четвертая попытка перейти на Windows 11 или как оптимально настроить LTSC 24H2 для игр
KAA
18:47
Может быть просто не надо называть все это число поделок играми, тогда и статистика по действительно играм получится совсем иная?
Половина из 19 000 выпущенных 2025 году в Steam игр оказались никому не нужными
Евгений Шрайнер
18:45
Нет, но наверное корейцы построят значительно дешевле
Южнокорейская Hanwha построит в США завод за $1 млрд по производству зарядов для 155-мм гаубиц
KAA
18:45
Может правильно говорить, что звонки в WhatsApp придушили так, что они полностью перестали работать. При этом все пользователи на месте. Здесь точно требовалась какая-то аналитика?
Активность россиян в WhatsApp упала при сохранении количества пользователей мессенджера в России
Archimedes
18:34
И гений Бартини. Хоть бы раз упомянули.
Россия возвращается к идее экранопланов
Oxygen89
18:24
давно было..последние пару лет точно нет
Моя четвертая попытка перейти на Windows 11 или как оптимально настроить LTSC 24H2 для игр
