Платим блогерам
Блоги
Moleculo
Невероятная вычислительная производительность.

Ускоритель вычислений AMD Instinct MI100 на базе архитектуры CDNA мог похвастаться рекордной производительностью в операциях двойной точности и интересными архитектурными нововведениями, среди которых было наличие Matrix Core для ускорения вычислительных операций с матрицами. Спустя год AMD представляет следующее поколение Instinct на базе второй итерации архитектуры CDNA с еще большей производительностью и большим количеством впечатляющих изменений.

Серия ускорителей вычислений AMD Instinct MI200 объединяет три модели: MI250X, MI250 и MI210. Первые две выполнены в форм-факторе OCP Accelerator Module (OAM) и доступны клиентам уже сегодня, а MI210 это версия ускорителя с интерфейсом PCIe, которая появится позже. Графические процессоры выполнены по 6-нм техпроцессу TSMC и используют мульти-чип дизайн с парой графических чиплетов и применением технологии гибридной 2.5D упаковки Elevated Fanout Bridge (EFB). Шина Infinity Fabric 3-го поколения предусматривает до 8 каналов соединения процессоров AMD EPYC 3-го поколения и ускорителей Instinct MI200 с целью эффективной и согласованной работы с памятью.

Спецификации AMD Instinct MI100. Источник: AMD
Спецификации новых Instinct MI250X и MI250. Источник: AMD

реклама

В общей совокупности флагманский графический процессор в AMD Instinct MI250X содержит 58 млрд транзисторов, 220 вычислительных блоков (14080 потоковых процессоров) и 880 блоков для матричных операций 2-го поколения. Графические чиплеты соседствуют с восемью стеками памяти HBM2e общим объемом 128 ГБ и пропускной способностью 3,2 ТБ/с. AMD позиционирует Instinct MI200 как ускорители экзафлопсного класса, сообщая о невероятном приросте производительности и преимуществе относительно MI100 и конкурентного решения NVIDIA A100.

Если говорить о векторных вычислениях FP64 и FP32, то относительно MI100 новый MI250X в 4 и 2 раза быстрее соответственно. Возросло количество FP64 матричных операций, удвоилось количество операций с матрицами FP32. В 4 раза увеличилась пиковая вычислительная производительность BF16, в 2 раза INT4 и INT8.

Ускорители AMD Instinct MI250X с процессорами EPYC 3-го поколения уже используются в суперкомпьютере HPE Frontier с ожидаемой пиковой вычислительной производительностью более 1,5 экзафлопс, Frontier был разработан для Окриджской национальной лаборатории Министерства энергетики США. Также ускорители Instinct MI250X доступны в суперкомпьютере HPE Cray EX, а в первом квартале следующего года Instinct серии MI200 появятся в еще большем количестве вычислительных систем.

Источник: ir.amd.com
4
Показать комментарии (4)

Популярные новости

Сейчас обсуждают