NVIDIA анонсировала графические процессоры Rubin, Rubin Ultra и Feynman

Озвучены планы по выпуску до 2028 года.
19 марта 2025, среда 13:29
molexandr для раздела Блоги

На конференции GTC 2025 компания NVIDIA представила планы по выпуску следующих поколений графических процессоров для центров обработки данных под названиями Rubin и Rubin Ultra, запланированных на 2026 и 2027 годы соответственно, сообщает Tom’s Hardware. Говорится о значительных улучшениях, по сравнению с текущей архитектурой Blackwell, которые направлены на резкое увеличение производительности и объёма памяти. NVIDIA также анонсировала будущую архитектуру, названную в честь физика Ричарда Фейнмана.

Источник изображения: NVIDIA, Tom's Hardware

Предстоящий графический процессор Rubin будет иметь инновационный дизайн с несколькими кристаллами в одном корпусе и увеличит вычислительную производительность в 3,3 раза, по сравнению с Blackwell B300 — 3,6 петафлопс на плотных вычислениях FP4 и 1,2 эксафлопс при обучении ИИ с использованием FP8. Rubin также переходит на память HBM4, увеличивая пропускную способность с 8 ТБ/с до 13 ТБ/с при сохранении объёма памяти 288 ГБ на графический процессор.

С выходом Rubin Ultra во второй половине 2027 года появится новая конфигурация NVL576 — до 576 графических процессоров на стойку — 15 эксафлопс производительности на логических выводах FP4 и 5 эксафлопс для обучения FP8 — четырёхкратный прирост относительно Rubin. Используется память HBM4e с увеличенной пропускной способностью, общий объём памяти в стойке вырастет до 365 ТБ.

  • Rubin (2026): Значительное повышение производительности по сравнению с Blackwell, использует память HBM4 и конфигурацию NVL144.
  • Rubin Ultra (2027): Огромная масштабируемость до 576 графических процессоров в стойке, использует память HBM4e.

Feynman — будущая архитектура NVIDIA будет названа в честь физика Ричарда Фейнмана. Ускорители на базе этой архитектуры ожидаются в 2028 году. Помимо дальнейшего повышения производительности ожидается обновление интерфейсов NVLink и новые сетевые решения для более высокой скорости связи между графическими процессорами внутри стоек, между стойками и кластерами.