Ускорители NVIDIA Blackwell B200 до 2,2 раз производительнее Hopper в тестах обучения MLPerf

Компания намеревается ещё повысить производительность.
14 ноября 2024, четверг 14:01
molexandr для раздела Блоги

NVIDIA опубликовала предварительные результаты тестирования новой серверной платформы с графическими ускорителями Blackwell B200, заявив о значительном повышении производительности во всех тестах MLPerf Training — до 2,2 раз в пересчёте на каждый графический процессор. В частности, каждый графический процессор Blackwell продемонстрировал двукратное повышение производительности предварительного обучения GPT-3 относительно предшественника в лице Hopper H200, передаёт Guru3D.

Источник: NVIDIA

Каждая из систем содержала по восемь графических процессоров Blackwell с памятью HBM3e, каждый настроен на работу с расчётной тепловой мощностью 1000 ватт (Вт). Графические процессоры были соединены между собой с помощью технологии NVLink 5-го поколения. Сетевая инфраструктура включала в себя модули NVIDIA ConnectX-7 SuperNIC и коммутаторы Quantum-2 InfiniBand, которые обеспечили высокоскоростную связь между узлами для распределённых рабочих нагрузок.

Для сравнения, системам на базе Hopper требовалось 256 графических процессоров для оптимизации производительности в тесте GPT-3 175B, тогда как архитектура Blackwell достигла сопоставимой производительности только с 64 графическими процессорами. Эта эффективность объясняется большим объёмом памяти и большей пропускной способностью HBM3e.

NVIDIA планирует выпустить систему GB200 NVL72 с ещё большей производительностью за счёт применения более быстрой памяти, более тесной интеграции с процессорами NVIDIA Grace, использования коммутаторов ConnectX-8 SuperNIC и Quantum-X800, улучшения NVLink.

Теги