реклама
Если посмотреть внимательно на графические архитектуры последних поколений, то можно заметить незначительный прирост производительности как в готовых решениях NVIDIA, так и у AMD. Для того чтобы сделать флагманы более привлекательными, обе компании значительно увеличили количество ядер, шейдеров и транзисторов, но в среднем и средневысоком ценовом сегменте прирост скорости между поколениями оказался незначительным, либо отсутствует. Ну а один из руководителей красной команды и вовсе заявил, что времена прорывных графических архитектур ушли в прошлое, а переход на более тонкий технологический процесс даёт невысокий результат. В итоге нужно увеличивать теплопакет и другие характеристики. Некоторые эксперты и вовсе уверены, что решением может стать искусственный интеллект, который возьмёт на себя расчёты и позволит ещё какое-то время наращивать производительность в коммерческих решениях. На самом деле точного ответа никто не знает, а уже через год состоится релиз новой линейки видеокарт GeForce RTX 50.
реклама
Инсайдеры полагают, что NVIDIA будет придерживаться двухгодичного цикла, указывая на скорой приход графической архитектуры Blackwell. Стоит помнить, что вся указанная ниже информация не была и никогда не будет официально подтверждена, а в итоге может оказаться ложной. И всё же, поскольку других данных пока нет, давайте изучим некоторые подробности. Согласно опубликованным слухам, первоначально NVIDIA выпустит графический чип GB100, ориентированный на облачные вычисления и обучение ИИ. С высокой долей вероятности можно сказать, что решение будет основано на 3-нм техпроцессе TSMC, который появится на рынке незадолго перед массовым выходом видеокарт зелёной команды.
Ожидается, что графический процессор GB100 станет первым готовым решением NVIDIA, использующим концепцию MCM (многокристальный модуль). Он будет состоять из 8 GPC (графических кластеров), каждый из которых включает в себя 10 TPC (подкластеров текстурной обработки), при этом каждый TPC содержит 2 SM, что в итоге даёт 160 блоков на полном кристалле. Также стоит отметить наличие 8192-битного интерфейса шины памяти HBM3e. В отличие от предыдущих архитектур Ampere и Hopper, где количество ядер FP32/FP64 различается, предполагается, что Blackwell будет иметь 128 ядер FP32 на каждый SM. Это означает, что на полном кристалле будет доступно 20 480 ядер FP32. Ниже представлено сравнение архитектур HPC от NVIDIA:
- A100 (Ampere) – 8 GPC / 64 TPC / 128 SM / 64 ядра на SM / 8192 ядра / 5120-битная шина
- H100 (Hopper) - 8 GPC / 72 TPC / 144 SM / 128 ядер на SM / 18 432 ядра / 5120-битная шина
- B100 (Blackwell) - 8 GPC / 80 TPC / 160 SM / 128 ядер на SM / 20 480 ядер / 8192-битная шина
Что касается игровой части, существуют слухи о графическом процессоре GB202, который имеет несколько другую конфигурацию по сравнению с предыдущими игровыми чипами (назовём его GeForce RTX 5090). Ожидается, что он будет состоять из 12 GPC и в общей сложности 8 TPC, что даёт до 96 TPC на полном кристалле или 192 SM. Если NVIDIA придерживается 128 ядрам FP32 на каждый SM, это приведёт к наличию 24 576 ядер, что означает увеличение количества ядер на 33% по сравнению с полным графическим процессором AD102 (GeForce RTX 4090). Скорее всего, NVIDIA выпустит две версии графического процессора GB202 для линейки GeForce RTX 50: урезанный вариант и более мощную версию, чтобы удовлетворить потребности энтузиастов и не потерять статус на рынке. Также есть информация о том, что графический процессор GB202 Blackwell получит более широкий 512-битный интерфейс, что на 33% превышает действующие значение для флагмана GeForce RTX 4090.
Инсайдеры также полагают, что новый флагман NVIDIA будет иметь увеличение количества ядер на 50%, повышение пропускной способности памяти на 52%, увеличение размера кэша на 78% и рост частоты ядра на 15%. Это должно привести к увеличению общей производительности графического процессора на 70%. Отметим, что на данный момент слишком рано делать окончательные выводы, так как NVIDIA всё ещё работает над несколькими вариантами своих продуктов перед выпуском на рынок. Известно лишь, что компания уже рассматривает модули DRAM следующего поколения GDDR7 с увеличенной пропускной способностью, что может значительно увеличить производительность игровых видеокарт.