Производительность AMD Radeon Instinct MI100 намного выше, чем у NVIDIA A100 в FP32

Предполагаемые показатели производительности ускорителя Radeon Instinct MI100 на базе CDNA GPU следующего поколения сегодня были опубликованы на AdoredTV.

30 июля 2020, четверг 16:43

goldas [ ] для раздела Блоги

Предполагаемые показатели производительности ускорителя Radeon Instinct MI100 на базе CDNA GPU следующего поколения сегодня были опубликованы на AdoredTV. В эксклюзивном посте AdoredTV рассказывает о тестах производительности предстоящего графического процессора AMD и графических процессоров NVIDIA поколений Volta и Ampere.

AdoredTV утверждает, что полученные ими слайды взяты из официальной презентации AMD Radeon Instinct MI100. Слайды от AdoredTV проливают некоторый свет на планы запуска и конфигурации серверов, которые можно ожидать от AMD и ее партнеров в 2020 году.

Компания AMD планирует представить специальный сервер HPC, который будет иметь 2P дизайн с двумя процессорами AMD EPYC поколении MILAN или ROME. Каждый процессор EPYC будет подключен к двум ускорителям Radeon Instinct MI100 через соединение Infinity Fabric 2-го поколения. Четыре графических процессора смогут обеспечить производительность 136 TFLOP в FP32 (SGEMM), что говорит о производительности около 34 TFLOP в вычислениях FP32 на один GPU. Каждый графический процессор Radeon Instinct MI100 будет иметь TDP 300 Вт.

Объединенная пропускная способность памяти четырех графических процессоров составляет 4,9 ТБ/с, что означает использование памяти HBM2e (каждый графический процессор имеет полосу пропускания 1,225 ТБ/с). Общий объем памяти составляет 128 ГБ или 32 ГБ на графический процессор. Это говорит о том, что AMD все еще использует стек с 4 чипами HBM2. Похоже, XGMI не будет предлагаться в стандартных конфигурациях и будет ограничен стойками типоразмера 1U.

Что касается доступности, то сервер 1U с процессорами AMD EPYC, будет выпущен к декабрю 2020 года, в то время как серверы на процессорах Intel Xeon ожидаются к запуску в феврале 2021 года.

Другой сервер типа 3U будет запущен в марте 2021 года и будет предлагать еще более внушительные характеристики, такие как 8 графических процессоров Radeon Instinct MI100, подключенных к двум процессорам EPYC. Блок из четырех ускорителей Instinct будет иметь производительность 272 TFLOP в вычислениях FP32 с пропускной способностью PCIe 512 Гб/с, HBM 9,8 Тб/с и объемом памяти 256 Гб. Стойка будет иметь номинальную потребляемую мощность 3000 Вт.

Согласно тестам, Radeon Instinct MI100 обеспечивает примерно на 13% лучшую производительность FP32 по сравнению с GPU Ampere A100 и более чем 2-кратное превосходство по сравнению с графическими процессорами Volta V100. Отношение производительности к значению также сравнивается с MI100, предлагая примерно в 2,4 раза лучшее значение по сравнению с V100S и на 50% лучше, чем Ampere A100. Масштабирование производительности является практически линейным при увеличении количества графических процессоров, что весьма впечатляет.

Однако в рабочих нагрузках HPC, таких как вычисления FP64, AI и анализе данных, NVIDIA предложит гораздо более высокую производительность благодаря ускорителю A100. NVIDIA также обладает преимуществами архитектуры Multi-Instance GPU по сравнению с AMD. A100 показывают в 2,5 раза лучшую производительность FP64, в 2 раза лучшую производительность FP16.