Платим блогерам
Блоги
goldas
Об этом говорят внутренние тесты компании Intel

реклама

 Компания Intel подробно рассказала о графическом процессоре Ponte Vecchio Xe-HPC на Hot Chips 34. В предоставленных тестах производитель утверждает, что Ponte Vecchio обеспечивает до 2,5 раз большую производительность, чем текущее решение Nvidia A100. Но, как обычно, относиться к бенчмаркам, предоставленным поставщиком, необходимо осторожно.

реклама

 Итак, согласно информации Intel, Ponte Vecchio значительно превзошел A100 в нескольких тестах. Мощный процессор Intel также продемонстрировал 2-кратное преимущество в miniBUDE и 1,5-кратное преимущество в ExaSMR. Это интересное сравнение, учитывая, что Ponte Vecchio еще даже не вышел, а A100 на архитектуре Ampere присутствует на рынке с 2020 года. Кроме того не стоит забывать, что по имеющейся информации AMD Instinct MI250X (Aldebaran) в три раза быстрее, чем A100. Таким образом Intel не стоило бы так расхваливать свои грядущие вычислительные процессоры особенно в сравнении с HPC-продуктами AMD и Nvidia следующего поколения.

 Но, если цифры Intel верны, то Ponte Vecchio в любом случае может стать потенциальным конкурентом Nvidia H100 следующего поколения. Судя по имеющимся спецификациям, H100 должен быть как минимум в два раза быстрее, чем A100. Но еще более интересным может стать сравнение с AMD Instinct MI300, который объединяет чиплеты Zen 4 и CDNA 3 в одном продукте. AMD утверждает, что Instinct MI300, названный компанией первым в мире APU для центров обработки данных, покажет восьмикратное повышение производительности ИИ по сравнению с Instinct MI250X.

 В форм-факторе OAM Ponte Vecchio может похвастаться поддержкой платформ с четырьмя и восемью графическими процессорами. Конфигурация Ponte Vecchio с двумя стеками выдает производительность 52 терафлопс в FP32 и FP64. Для сравнения, один модуль H100 показывает максимальную производительность 60 терафлопс при FP32 и 30 терафлопс при FP64.

 Ponte Vecchio имеет регистровый файл размером 64 МБ, обеспечивающий пропускную способность до 419 ТБ/с. Кэш L1 и L2 составляют 64 МБ и 408 МБ соответственно. Большой размер кэша L2 в Ponte Vecchio будет полезен для определенных рабочих нагрузок, таких как 2D-FFT Case и DNN Case. В презентации результаты Intel показывают существенное улучшение производительности с 80 МБ до 408 МБ в обоих сценариях.

Источник: tomshardware.com
+
Написать комментарий (0)

Популярные новости

Сейчас обсуждают