Платим блогерам
Блоги
goldas
NVIDIA раскрыла технические характеристики ускорителя Blackwell Ultra GB300
реклама

NVIDIA представила подробную информацию об ускорителе Blackwell Ultra GB300. Чип отличается увеличенным числом ядер, объёмом памяти, поддержкой хостов I/O и запасом мощности по сравнению с GB200. Новый GB300 использует два кристалла на базе техпроцесса TSMC 4NP, которые работают как один графический процессор. Кристаллы соединены с помощью шины NV-HBI со скоростью 10 ТБ/с и содержат в общей сложности около 208 миллиардов транзисторов.

Графический процессор содержит 160 потоковых мультипроцессоров. Каждый содержит 128 ядер CUDA (всего 20480 ядер) и тензорные ядра 5-го поколения с форматами FP8, FP6 и новым NVFP4. Каждый мультипроцессор также имеет 256 КБ тензорной памяти (TMEM), что составляет 40 МБ на графический процессор, а также дополнительные блоки специальных функций для ядра математических вычислений.

реклама

Память включает восемь 12-Hi стеков HBM3E с общим объемом 288 ГБ. Пропускная способность составляет 8 ТБ/с благодаря топологии контроллера 16x512 бит (8192-битный интерфейс). Мощность ускорителя увеличилась до 1400 Вт.

Подключение между графическими процессорами по-прежнему осуществляется по NVLink 5 со скоростью 1,8 ТБ/с в обоих направлениях на каждый графический процессор. Соединения Grace-GPU продолжают использовать NVLink-C2C со скоростью 900 ГБ/с с когерентностью. Подключение к хосту осуществляется по интерфейсу PCIe 6.0 x16 с пропускной способностью 256 ГБ/с в обоих направлениях, что делает GB300 первым продуктом NVIDIA с таким интерфейсом. Варианты платформы включают стойки GB300 NVL72, объединяющие 72 графических процессора, до 20,7 ТБ памяти HBM3E и общую пропускную способность 576 ТБ/с. Grace Superchip по-прежнему использует процессор с 72 ядрами Arm и 480 ГБ памяти LPDDR5X со скоростью 512 ГБ/с.

NVFP4 является новым форматом данных с низкой точностью, реализованный в тензорных ядрах. Он сочетает масштабирование микроблоков FP8 (E4M3) на блоках по 16 значений с масштабированием на уровне FP32. Формат обеспечивает точность, близкую к FP8, при одновременном сокращении объёма памяти примерно в 1,8 раза по сравнению с FP8 и до 3,5 раза по сравнению с FP16.

NVIDIA заявляет, что GB300 уже находится в массовом производстве и отгружается первым заказчикам. Интересно, что разработка архитектуры Rubin, следующей за ней, также завершена.

Источник: videocardz.com
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости