Компания NVIDIA впервые продемонстрировала «суперчип» (англ. Superchip) нового поколения Vera Rubin вживую на конференции GTC 2025 в Вашингтоне (округ Колумбия, США). Система, представленная на сцене генеральным директором компании Дженсеном Хуангом (Jensen Huang), объединяет на одной плате центральный процессор Vera с двумя большими графическими процессорами Rubin. Это следующий шаг компании в области ускорения вычислений для искусственного интеллекта (ИИ), пишет VideoCardz.
Источник изображения: NVIDIA, YouTube
Размеры прототипа NVIDIA Vera Rubin Superchip сопоставимы с размерами полноразмерной материнской платы для настольного ПК, суперчип даже больше. Кроме центрального и графических процессоров на плате располагается LPDDR память (по всей видимости, в формате LPCAMM), HBM4 память, а также множество прочих компонентов. В NVIDIA подтвердили, что первые графические процессоры Rubin уже поступили во внутренние лаборатории, а массовое производство суперчипа запланировано на 2026 год.
Каждый графический процессор NVIDIA Rubin состоит из двух кристаллов с размерами, близкими к пределам фотолитографической маски, обеспечивая производительность до 50 петафлопс на операциях с числами формата FP4. Каждый графический процессор оснащается 288 ГБ памяти HBM4. В состав центрального процессора Vera входит 88 ядер на базе архитектуры Arm с поддержкой одновременной многопоточности. Центральный и графический процессоры связывает интерфейс NVLINK-C2C с пропускной способностью 1,8 ТБ/с.
Источник изображения: NVIDIA, YouTube
NVIDIA заявляет, что серверная система NVL144 (число соответствует количеству графических процессоров) обеспечит вычислительную производительность до 3,6 эксафлопс на операциях с числами формата FP4 и 1,2 эксафлопс на операциях FP8. Это более чем в три раза быстрее текущей системы NVL72 с суперчипами GB300 Grace Blackwell. Общая пропускная способность памяти возрастает до 13 ТБ/с, интерфейса NVLINK до 260 ТБ/с, а сетевых адаптеров CX9 SuperNIC — до 28,8 ТБ/с.
Компания также рассказала о графических процессорах Rubin Ultra для ещё более крупномасштабных систем NVL576, выпуск которых ожидается во второй половине 2027 года. В этой конфигурации каждый графический процессор с целевой производительностью 15 эксафлопс на операциях FP4 объединяет четыре кристалла и 1 ТБ памяти HBM4e. Пропускная способность сети в этой системе достигает 1,5 ПБ/с.
Источник изображения: NVIDIA, YouTube
NVIDIA разрабатывает различные конфигурации оборудования для различных задач, включая обеспечение работы моделей ИИ с огромным контекстным окном.
В 2028 году NVIDIA планирует представить графические процессоры следующего поколения Feynman.

