Производительность AMD Radeon Instinct MI100 намного выше, чем у NVIDIA A100 в FP32

[ ] для раздела Блоги

 Предполагаемые показатели производительности ускорителя Radeon Instinct MI100 на базе CDNA GPU следующего поколения сегодня были опубликованы на AdoredTV. В эксклюзивном посте AdoredTV рассказывает о тестах производительности предстоящего графического процессора AMD и графических процессоров NVIDIA  поколений Volta и Ampere.

 AdoredTV утверждает, что полученные ими слайды взяты из официальной презентации AMD Radeon Instinct MI100. Слайды от AdoredTV проливают некоторый свет на планы запуска и конфигурации серверов, которые можно ожидать от AMD и ее партнеров в 2020 году.

 Компания AMD планирует представить специальный сервер HPC, который будет иметь 2P дизайн с двумя процессорами AMD EPYC поколении MILAN или ROME. Каждый процессор EPYC будет подключен к двум ускорителям Radeon Instinct MI100 через соединение Infinity Fabric 2-го поколения. Четыре графических процессора смогут обеспечить производительность 136 TFLOP в FP32 (SGEMM), что говорит о производительности около 34 TFLOP в вычислениях FP32 на один GPU. Каждый графический процессор Radeon Instinct MI100 будет иметь TDP 300 Вт.

реклама

 Объединенная пропускная способность памяти четырех графических процессоров составляет 4,9 ТБ/с, что означает использование памяти HBM2e (каждый графический процессор имеет полосу пропускания 1,225 ТБ/с). Общий объем памяти составляет 128 ГБ или 32 ГБ на графический процессор. Это говорит о том, что AMD все еще использует стек с 4 чипами HBM2. Похоже, XGMI не будет предлагаться в стандартных конфигурациях и будет ограничен стойками типоразмера 1U.

 Что касается доступности, то сервер 1U с процессорами AMD EPYC, будет выпущен к декабрю 2020 года, в то время как серверы на процессорах Intel Xeon ожидаются к запуску в феврале 2021 года.

 Другой сервер типа 3U будет запущен в марте 2021 года и будет предлагать еще более внушительные характеристики, такие как 8 графических процессоров Radeon Instinct MI100, подключенных к двум процессорам EPYC. Блок из четырех ускорителей Instinct будет иметь производительность 272 TFLOP в вычислениях FP32 с пропускной способностью PCIe 512 Гб/с, HBM 9,8 Тб/с и объемом памяти 256 Гб. Стойка будет иметь номинальную потребляемую мощность 3000 Вт.

анонсы и реклама

 Согласно тестам, Radeon Instinct MI100 обеспечивает примерно на 13% лучшую производительность FP32 по сравнению с GPU Ampere A100 и более чем 2-кратное превосходство по сравнению с графическими процессорами Volta V100. Отношение производительности к значению также сравнивается с MI100, предлагая примерно в 2,4 раза лучшее значение по сравнению с V100S и на 50% лучше, чем Ampere A100. Масштабирование производительности является практически линейным при увеличении количества графических процессоров, что весьма впечатляет.

 Однако в рабочих нагрузках HPC, таких как вычисления FP64, AI и анализе данных, NVIDIA предложит гораздо более высокую производительность благодаря ускорителю A100. NVIDIA также обладает преимуществами архитектуры Multi-Instance GPU по сравнению с AMD. A100 показывают в 2,5 раза лучшую производительность FP64, в 2 раза лучшую производительность FP16.

Подпишитесь на наш канал в Яндекс.Дзен или telegram-канал @overclockers_news - это удобные способы следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.

Комментарии Правила

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают