NVIDIA самостоятельно сравнила возможности Google TPU с ускорителями P40


На прошлой неделе компания Google опубликовала результаты тестирования фирменных решений Tensor Processing Unit (TPU) на базе заказных БИС и сравнила их с ускорителями K80 компании NVIDIA и процессорами Intel Xeon. Согласно полученным в Google результатам, для решения задач с глубоким машинным обучением TPU Google оказываются в 30-80 раз лучше, чем серийная продукция Intel и NVIDIA. Вчера компания NVIDIA усомнилась в справедливости выводов специалистов Google. Точнее, она предложила сравнить возможности TPU Google с актуальными ускорителями P40, а не адаптерами K80, выпущенными пять лет назад.

По мнению NVIDIA, ускорители P40 двукратно превосходят TPU Google по соотношению принятых решений в секунду с уровнем задержек менее 10 мс. Уточним, операция по принятию решения (inferences) уже включает в себя операции по машинному обучению (training). При этом в NVIDIA уверены, что сочетание высокой производительности при вычислениях с одинарной точностью на уровне 12 терафлопс и 10-кратное преимущество P40 при доступе к памяти позволяют решению NVIDIA продемонстрировать превосходство над TPU Google.

В то же время при работе с 8-битными операциями, характерными для тензорного счисления, TPU Google обещают наиболее оптимальное выполнение вычислительной нагрузки. В составе TPU 98 исполнительных блоков INT8, а в GPU P40 таких всего 48. За счёт этого TPU Google показывает хороший результат при обработке тензорных массивов при потреблении 75 Вт по сравнению с 250-Вт ускорителем NVIDIA P40. Стоит отметить, что в NVIDIA поддержали решение Google создать ускоритель для глубокого машинного обучения с использованием тензоров. По мнению специалистов — это наиболее верный путь для обработки больших массивов данных для широкого спектра задач, связанных с машинным обучением. Компания Intel, кстати, тоже создаёт ускоритель для обработки тензоров (Lake Crest).

Оценитe материал
рейтинг: 3.9 из 5
голосов: 15

Возможно вас заинтересует

Сейчас обсуждают