Генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang) представил (VideoCardz) на конференции GTC 2024 архитектуру для ускорителей вычислений нового поколения и платформ на их основе. Архитектура, названная в честь Дэвида Гарольда Блэквелла (David Harold Blackwell), американского математика, специализирующегося на теории игр и статистике, приходит на смену архитектуре Hopper.
В частности, на мероприятии был показан B200, флагманский чип на базе архитектуры Blackwell, который объединяет в одном корпусе два графических кристалла.
Для соединения кристаллов в B200 используется технология NV-HBI (NVIDIA High Bandwidth Interface) со скоростью 10 терабайт в секунду. Размер каждого графического кристалла совпадает с максимальным размером прицельной сетки, точные размеры не уточняются, по предположениям специалистов AnandTech, площадь каждого графического кристалла превышает 800 мм2. Это очень большой чип с общим количеством транзисторов 208 миллиардов. Производится B200 по технологии TSMC 4NP, улучшенной версии технологии 4N. Каждый графический кристалл соединён с четырьмя стеками памяти HBM3E по 24 ГБ. В целом B200 предлагает 192 ГБ HBM3E памяти с общей эффективной шиной 8192 бита и совокупной пропускной способностью 8 терабайт в секунду.
NVIDIA называет B200 самым мощным чипом в мире. В архитектуре Blackwell реализована поддержка Transformer Engine 2-го поколения для ускорения моделей искусственного интеллекта с архитектурой трансформер (transformer). Компания говорит о 2,5-кратном приросте вычислительной производительности относительно архитектуры Hopper на операциях более низкой точности FP8 и FP6, а также о 5-кратном приросте вычислительной производительности за счёт поддержки формата FP4.
К другим ключевым особенностям Blackwell относятся:
Чип NVIDIA B200 ляжет в основу различных продуктов компании, включая «суперчип» NVIDIA GB200 Grace Blackwell, который объединит два чипа B200 и процессор Grace. На базе этих суперчипов разработана стоечная система с жидкостным охлаждением под названием NVIDIA GB200 NVL72.
Каждая такая система насчитывает 36 суперчипов GB200, 72 чипа B200 соответственно, и нацелена на 30-кратный прирост производительности при снижении затрат на электроэнергию до 25 раз, по сравнению с тем же количеством графических процессоров NVIDIA H100. Платформа действует как один графический процессор с производительностью искусственного интеллекта 1,4 эксафлопс. На базе этих платформ создаётся новая масштабируемая архитектура суперкомпьютеров DGX SuperPOD.
Продукты на базе архитектуры Blackwell появятся в этом году.