NVIDIA рассказала на конференции Hot Chips 34 о своих новейших разработках, включая графический процессор для ускорения вычислений H100 на базе архитектуры Hopper. Среди большого объёма информации о производительности, особенностях и возможностях нового ускорителя в обзоре презентации NVIDIA от ресурса Wccftech также отмечается тема масштабирования решений за последнее десятилетие. Занятная деталь, в H100 один графический кластер GPC, основной блок GPU, эквивалентен всему GK110 поколения Kepler — флагманскому GPU для высокопроизводительных вычислений 2012 года. В общей совокупности Kepler GK110 содержит 15 потоковых мультипроцессоров SM, тогда как в Hopper H100 только один GPC содержит 18 SM.
NVIDIA H100 был представлен в марте этого года, GPU изготавливается TSMC по оптимизированному для NVIDIA 4-нм техпроцессу 4N, применение технологии 2.5D упаковки CoWoS позволило снабдить решение шестью стеками новейшей HBM3 памяти общим объёмом 80 ГБ и пропускной способностью 3 ТБ/с.
Всего H100 содержит 8 кластеров GPC в каждом из которых находится 9 текстурных кластеров TPC, они, в свою очередь, содержат по 2 SM и в конечном итоге полный GPU объединяет 144 SM, но в решении формата SXM5 для дата-центров активны 132 SM (16896 FP32 ядер). В A100 на базе архитектуры Ampere активны 108 SM (6912 FP32 ядер), т.е. новое решение предлагает примерно на 20% больше блоков SM, но это не оказывает наибольшее влияние на прирост производительности. Больший вклад вносят новые тензорные ядра 4-го поколения и поддержка формата вычислений FP8, и то и другое обеспечивает двукратный прирост, а всё вместе с более высокой тактовой частотой позволяет Hopper H100 до 6 раз опережать предшественника Ampere A100.