Подробно о характеристиках графического процессора NVIDIA GV100 на архитектуре Volta

для раздела Новости Hardware

После рассказов о ускорителях вычислений Tesla V100 и вычислительных систем на их базе пришла пора рассказать и о том, что же лежит в основе данных ускорителей, а именно о графических процессорах NVIDIA GV100 построенных на новой архитектуре Volta. Конечно же, рассказ будет опираться на официальные данные.

реклама

Нажмите на изображение для увеличения

реклама

Как мы писали ранее, графический процессор GV100 выполнен по технологическим нормам 12-нм FFN и имеет площадь 815 кв.м, что делает его самым большим GPU, из когда-либо созданных. Всего данный графический процессор включает 84 потоковых мультипроцессора (Streaming Multiprocessor – SM), но в Tesla V100 использована его конфигурация только с 80 активными SM.

Данные мультипроцессоры выполнены с использованием новой архитектуры, оптимизированной для глубокого обучения. Оптимизация заключается в том, что помимо 64 ядер FP32 и 32 ядер FP64, каждый SM включает восемь новых тензорных ядер, как раз и предназначенных для задач глубинного обучения. В итоге Tesla V100 располагает 5120 ядрами CUDA (FP32), 2560 ядрами для FP64-вычислений и 640 тензорными ядрами.

реклама

Нажмите на изображение для увеличения

реклама

Также GPU располагает 320 текстурными блоками (по 4 на один SM). Объём кэш-памяти второго уровня вырос до 6144 Кбайт, разделяемой памяти – до 96 кБайт на SM и регистровой памяти – 2 Мбайт на GPU. Работает графический процессор GV100 с частотой 1455 МГц, а значение TDP для ускорителя Tesla V100 составляет 300 Вт. Объём памяти типа HBM2 равен 16 Гбайт, подключена она посредством 4096-битной шины и имеет пропускную способность в 900 Гбайт/с. Путём нехитрых вычислений можно определить, что частота памяти составляет около 1760 МГц.

реклама


Источник изображения: VideoCardz

Оценитe материал
рейтинг: 4.5 из 5
голосов: 37

Комментарии Правила

Возможно вас заинтересует

Сейчас обсуждают