Производительность AMD Radeon Instinct MI100 намного выше, чем у NVIDIA A100 в FP32
реклама
Предполагаемые показатели производительности ускорителя Radeon Instinct MI100 на базе CDNA GPU следующего поколения сегодня были опубликованы на AdoredTV. В эксклюзивном посте AdoredTV рассказывает о тестах производительности предстоящего графического процессора AMD и графических процессоров NVIDIA поколений Volta и Ampere.
AdoredTV утверждает, что полученные ими слайды взяты из официальной презентации AMD Radeon Instinct MI100. Слайды от AdoredTV проливают некоторый свет на планы запуска и конфигурации серверов, которые можно ожидать от AMD и ее партнеров в 2020 году.
Компания AMD планирует представить специальный сервер HPC, который будет иметь 2P дизайн с двумя процессорами AMD EPYC поколении MILAN или ROME. Каждый процессор EPYC будет подключен к двум ускорителям Radeon Instinct MI100 через соединение Infinity Fabric 2-го поколения. Четыре графических процессора смогут обеспечить производительность 136 TFLOP в FP32 (SGEMM), что говорит о производительности около 34 TFLOP в вычислениях FP32 на один GPU. Каждый графический процессор Radeon Instinct MI100 будет иметь TDP 300 Вт.
Объединенная пропускная способность памяти четырех графических процессоров составляет 4,9 ТБ/с, что означает использование памяти HBM2e (каждый графический процессор имеет полосу пропускания 1,225 ТБ/с). Общий объем памяти составляет 128 ГБ или 32 ГБ на графический процессор. Это говорит о том, что AMD все еще использует стек с 4 чипами HBM2. Похоже, XGMI не будет предлагаться в стандартных конфигурациях и будет ограничен стойками типоразмера 1U.
реклама
Что касается доступности, то сервер 1U с процессорами AMD EPYC, будет выпущен к декабрю 2020 года, в то время как серверы на процессорах Intel Xeon ожидаются к запуску в феврале 2021 года.
Другой сервер типа 3U будет запущен в марте 2021 года и будет предлагать еще более внушительные характеристики, такие как 8 графических процессоров Radeon Instinct MI100, подключенных к двум процессорам EPYC. Блок из четырех ускорителей Instinct будет иметь производительность 272 TFLOP в вычислениях FP32 с пропускной способностью PCIe 512 Гб/с, HBM 9,8 Тб/с и объемом памяти 256 Гб. Стойка будет иметь номинальную потребляемую мощность 3000 Вт.
Согласно тестам, Radeon Instinct MI100 обеспечивает примерно на 13% лучшую производительность FP32 по сравнению с GPU Ampere A100 и более чем 2-кратное превосходство по сравнению с графическими процессорами Volta V100. Отношение производительности к значению также сравнивается с MI100, предлагая примерно в 2,4 раза лучшее значение по сравнению с V100S и на 50% лучше, чем Ampere A100. Масштабирование производительности является практически линейным при увеличении количества графических процессоров, что весьма впечатляет.
Однако в рабочих нагрузках HPC, таких как вычисления FP64, AI и анализе данных, NVIDIA предложит гораздо более высокую производительность благодаря ускорителю A100. NVIDIA также обладает преимуществами архитектуры Multi-Instance GPU по сравнению с AMD. A100 показывают в 2,5 раза лучшую производительность FP64, в 2 раза лучшую производительность FP16.
реклама
Теги
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила