NVIDIA представила модуль GB200 NVL4 с чипами Blackwell и Grace общей мощностью 5,4 кВт

А также «пакеты» H200 NVL из нескольких графических ускорителей H200 Hopper для стандартных слотов PCIe.
19 ноября 2024, вторник 13:15
molexandr для раздела Блоги

Одним из самых крупных анонсов конференции Supercomputing 2024 стали новые решения NVIDIA для сегмента искусственного интеллекта (ИИ) и высокопроизводительных вычислений: во-первых, это массивный модуль GB200 NVL4, во-вторых, «пакеты» H200 NVL из нескольких графических ускорителей — сообщает HotHardware.

Источник изображения: NVIDIA, HotHardware

H200 NVL — это набор из четырёх графических ускорителей H200 Hopper для стандартных слотов PCIe, объединённых с помощью мостов NVLink со скоростью 900 гигабайт в секунду (ГБ/с). Соединение позволяет объединить память всех четырёх графических ускорителей в один большой пул и работать с ним напрямую. Каждый ускоритель предлагает 141 гигабайт (ГБ) видеопамяти HBM3e, конфигурация из четырёх ускорителей — 564 ГБ. Это решение нацелено на серверы с воздушным охлаждением и ограниченной мощностью до 20 киловатт (кВт) — в таких случаях развёртывание систем с ускорителями формата SXM затруднено или невозможно.

Источник изображения: NVIDIA, HotHardware

Новый модуль NVIDIA GB200 NVL4 объединяет на одной печатной плате два центральных процессора Grace и четыре графических процессора Blackwell B200, память и остальные компоненты — общая мощность 5,4 кВт. Каждый процессор сообщается со всеми остальными через NVLink. На плате размещено 768 ГБ видеопамяти HBM3 и 960 ГБ оперативной памяти LPDDR5X для процессоров Grace — в общей сложности 1,5 терабайта (ТБ) памяти на каждую плату. На первый взгляд, GB200 NVL4 является двумя склеенными суперчипами GB200, однако есть существенные отличия: несколько GB200 можно объединять с помощью NVLink, а GB200 NVL4 нет, вместо этого внешняя связь осуществляется либо через InfiniBand, либо через Ethernet, пишет HotHardware.

На конференции в NVIDIA напомнили, что в следующем году планируют выпустить Blackwell Ultra — улучшенную версию существующих ускорителей Blackwell с удвоенным объёмом памяти HBM3e и более высокой вычислительной производительностью в задачах, связанных с ИИ.