После рассказов о ускорителях вычислений Tesla V100 и вычислительных систем на их базе пришла пора рассказать и о том, что же лежит в основе данных ускорителей, а именно о графических процессорах NVIDIA GV100 построенных на новой архитектуре Volta. Конечно же, рассказ будет опираться на официальные данные.

Как мы писали ранее, графический процессор GV100 выполнен по технологическим нормам 12-нм FFN и имеет площадь 815 кв.м, что делает его самым большим GPU, из когда-либо созданных. Всего данный графический процессор включает 84 потоковых мультипроцессора (Streaming Multiprocessor – SM), но в Tesla V100 использована его конфигурация только с 80 активными SM.
Данные мультипроцессоры выполнены с использованием новой архитектуры, оптимизированной для глубокого обучения. Оптимизация заключается в том, что помимо 64 ядер FP32 и 32 ядер FP64, каждый SM включает восемь новых тензорных ядер, как раз и предназначенных для задач глубинного обучения. В итоге Tesla V100 располагает 5120 ядрами CUDA (FP32), 2560 ядрами для FP64-вычислений и 640 тензорными ядрами.

Также GPU располагает 320 текстурными блоками (по 4 на один SM). Объём кэш-памяти второго уровня вырос до 6144 Кбайт, разделяемой памяти – до 96 кБайт на SM и регистровой памяти – 2 Мбайт на GPU. Работает графический процессор GV100 с частотой 1455 МГц, а значение TDP для ускорителя Tesla V100 составляет 300 Вт. Объём памяти типа HBM2 равен 16 Гбайт, подключена она посредством 4096-битной шины и имеет пропускную способность в 900 Гбайт/с. Путём нехитрых вычислений можно определить, что частота памяти составляет около 1760 МГц.
