NVIDIA опубликовала предварительные результаты тестирования новой серверной платформы с графическими ускорителями Blackwell B200, заявив о значительном повышении производительности во всех тестах MLPerf Training — до 2,2 раз в пересчёте на каждый графический процессор. В частности, каждый графический процессор Blackwell продемонстрировал двукратное повышение производительности предварительного обучения GPT-3 относительно предшественника в лице Hopper H200, передаёт Guru3D.
Каждая из систем содержала по восемь графических процессоров Blackwell с памятью HBM3e, каждый настроен на работу с расчётной тепловой мощностью 1000 ватт (Вт). Графические процессоры были соединены между собой с помощью технологии NVLink 5-го поколения. Сетевая инфраструктура включала в себя модули NVIDIA ConnectX-7 SuperNIC и коммутаторы Quantum-2 InfiniBand, которые обеспечили высокоскоростную связь между узлами для распределённых рабочих нагрузок.
Для сравнения, системам на базе Hopper требовалось 256 графических процессоров для оптимизации производительности в тесте GPT-3 175B, тогда как архитектура Blackwell достигла сопоставимой производительности только с 64 графическими процессорами. Эта эффективность объясняется большим объёмом памяти и большей пропускной способностью HBM3e.
NVIDIA планирует выпустить систему GB200 NVL72 с ещё большей производительностью за счёт применения более быстрой памяти, более тесной интеграции с процессорами NVIDIA Grace, использования коммутаторов ConnectX-8 SuperNIC и Quantum-X800, улучшения NVLink.