Tesla V100 при задействовании тензорных вычислений оказалась в 3.7X раз быстрее Radeon MI60

для раздела Блоги
Начислено вознаграждение
Эта новость написана посетителем сайта, и за неё начислено вознаграждение.

Оказалось, что паритет MI60 и V100 в глубоком машинном обучении достигается только в стандартной точности операции с плавающей точкой (FP32), которая впрочем нередко бывает необходима, например, для достижения точности 99,99% для FaceID (который используется в банковской индентификации и ряде других случаев). 

реклама

Но при задействовании тензорных ядер (которые имеют смешанную точность) Tesla V100 отрыв последней на тех же задачах глубокого обучения достигает 3,5-3,7X раз в пользу решения nVidia. А конкурентом 300W MI60 в этом случае становится 70W Tesla T4. 

реклама

В общем, будем надеяться, что AMD знает, что делает - хотя конечно несколько смущает, что даже при равной производительности в FP32 - решение AMD потребляет на 20% больше электроэнергии (300W vs 250W), и это при значительно более тонком техпроцессе (7 nm vs 12 nm) и, как следствие, в x2.4 меньшей площади чипа.

Подпишитесь на наш канал в Яндекс.Дзен или telegram-канал @overclockers_news - это удобные способы следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал
рейтинг: 3.0 из 5
голосов: 6

Комментарии Правила

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают