В гонке ИИ-железа сравнение отдельных ускорителей все чаще уступает место оценке стоек целиком. Именно на этом уровне начинают проявляться архитектурные различия, которые на бумаге выглядят абстрактно, а в тестах — предельно наглядно.
WCCFTech сообщает, что в ходе тестирования архитектур MoE (Mixture of Experts) стойки NVIDIA Blackwell GB200 NVL72 показали заметное преимущество над решениями на базе AMD Instinct MI355X. Речь идет о среде, где ключевую роль играет не только вычислительная мощность, но и скорость обмена данными между узлами.
По данным тестов InferenceMAX от SemiAnalysis, пропускная способность на один GPU у GB200 достигает 75 токенов в секунду. В сопоставимой конфигурации кластеров это дало NVIDIA преимущество до 28 раз по сравнению с MI355X. Аналитики Signal65 связывают разрыв с подходом NVIDIA к совместному проектированию всей системы.
Стойка GB200 NVL72 использует 72 чипа и около 30 ТБ общей быстрой памяти. Такая конфигурация снижает задержки при взаимодействии «экспертов» внутри MoE-моделей, где постоянный обмен данными становится узким местом. По сути, NVIDIA решает проблему не ускорителем, а архитектурой стойки целиком.
Signal65 также отмечает экономический аспект. С учетом цен Oracle Cloud, GB200 NVL72 обеспечивает до 15 раз меньшую относительную стоимость токена при более высокой интерактивности. Именно этот фактор, а не только пиковая вычислительная производительность, делает платформу привлекательной для облачных провайдеров.
При этом сравнение затрагивает разные поколения. AMD еще не анонсировала свои стоечные системы следующего уровня, в то время как NVIDIA уже развернула Blackwell. Текущая платформа AMD, MI355X, делает ставку на высокую плотность и большую память HBM3e — это сильные стороны, но для архитектуры MoE критична именно скорость связи между чипами. По этому параметру в текущем поколении NVIDIA доминирует.