Новые патенты AMD и гадание о новой архитектуре GPU на их основе

Блоги

22 янв. 2019, 07:51 Dambeldor

Графическая архитектура AMD следующего поколения начинает проявляться на наших глазах. Недавно обнаруженная патентная заявка, опубликованная в середине декабря 2018 года, демонстрирует новый дизайн «после GCN» с высокой пропускной способностью и улучшенной энергоэффективностью потоковых процессоров. При этом большое внимание уделяется повышению мощности параллельных вычислений на графических процессорах следующего поколения и одновременному повышению их эффективности. И в этом месте как раз слаб дизайн SM от Nvidia.

Однако это не архитектура AMD Navi, как сообщается, в Navi будет последняя версия дизайна Graphics Core Next, представленного в 2012 году. Новый подход к потоковым процессорам, который должен воплотиться в архитектуре GPU, возможно, появится в 2020 году. Было предположение, что AMD Arcturus будет основан на 7nm дизайне. В текущей дорожной карте GPU, новой архитектурой предполагается одарить все новые графические процессоры в 2020 году.

Когда речь заходит об архитектурных особенностях новых графических ядер, я не лучший эксперт в этом деле. Поэтому, далее будут некоторые довольно умозрительные оценки, основанные на том, что мы можем почерпнуть из тяжелого технического языка, на котором подана заявка на патент. Мне надо было больше времени уделять этому в школе)

Ссылкой на патентную заявку поделился через твитер известный по многочисленным утечкам Komachi Ensaka – со следующим содержанием «STREAM PROCESSOR WITH HIGH BANDWIDTH AND LOW POWER VECTOR REGISTER FILE» , по-видимому, он вытекает из предыдущей заявки. Предыдущий патент был опубликован в мае прошлого года под названием: «Несколько данных в одной инструкции (Super-SIMD) для вычислений на графическом процессоре (GPU)».

Стандартный SIMD в текущей архитектуре Graphics Core Next просто содержит 16 арифметико-логических блоков (ALU), и каждый вычислительный блок (CU) имеет четыре из этих SIMD внутри - это даёт нам 64 «ядра». Когда мы говорим о Radeon VII с 3840 ядрами GCN, именно об этих «ядрах» идет речь. В архитектуре GCN вычислительный модуль является самым маленьким, полностью независимым модулем в графическом процессоре.

Вычислительные блоки имеют много общих ресурсов, таких как планировщики и системы кэширования, которые могут использовать все отдельные SIMD. Хотя очевидно, что все эти ресурсы нельзя использовать сразу, поэтому CU должен решить, когда будут обрабатываться инструкции в каждой SIMD. Это неизбежно может привести к узким местам в графическом процессоре, именно это и пытается решить последняя патентная заявка.

Новые потоковые процессоры с высокой пропускной способностью, содержат в себе гораздо больше логики, чем старый GCN-стиль простых ALU. Патент показывает, что каждый потоковый процессор больше похож на прежний вычислительный блок GCN, причем каждый из них содержит свои собственные очереди команд, кэш и буферы. Это может привести к тому, что каждое «ядро» станет самой маленькой независимой функционирующей частью графического процессора, поскольку они будут более приспособлены к выполнению задач, не дожидаясь использования общих ресурсов, встроенных в стандартный вычислительный блок (CU).

Предыдущая заявка имеет схему того, как будет выглядеть обновленный дизайн вычислительных блоков, когда в нем размещены четыре более сложных потоковых процессора, которые затем могут направлять завершенные задачи в планировщик и общий кэш в стоящий выше CU блок нового поколения.

Это не обязательно позволит AMD добавлять больше потоковых процессоров или «ядер» в свои графические процессоры, но это означает, что каждый из них обладает гораздо большими возможностями, чем предыдущая версия. Все это говорит о том, что новые ядра будут с меньшей вероятностью простаивать в ожидании доступности общих ресурсов графического процессора следующего поколения. Он сможет выполнять больше задач при параллельной обработке (больше вычислительных задач - за один тактовый цикл).

В патенте говорится, что один вариант конструкции потокового процессора содержит 16 ALU в общей компоновке - как и текущая модель GCN => другие варианты могут содержать - разное количество ALU. Тогда можно будет создавать либо более мощные в вычислительном плане чипы с большим количеством ALU внутри, либо более эффективные высоко распараллеленные маломощные чипы с меньшим количеством ALU.

Так как графическая архитектура AMD уже в значительной степени ориентирована на вычисления, дизайн следующего поколения Arcturus (возможно) может оказаться настоящим монстром. И с таким сложным строением внутри каждого потокового процессора в вычислительном блоке – не так далеко от дизайна потокового мультипроцессора (SM), который Nvidia использует для собственных графических процессоров. Тут есть потенциал не только для обещанной DirectML «DLSS-подобной функции», но полноценная поддержка DXR также может найти свое место.

Еще одна сторона более сложных потоковых процессоров заключается в том, что они должны вылиться в систему с более низким энергопотреблением. Они предназначены для обхода определенных буферов и предотвращения дублирующего использования ресурсов, а также имеют систему рециркуляции кеша. Значит ему не нужно повторно извлекать данные, с которыми потоковый процессор должен работать снова.

Параллели между существующим потоковым мультипроцессорным дизайном Nvidia и этим потенциальным дизайном потоковых процессоров AMD нетрудно проанализировать. Внедрив больше логики в мельчайшие части своих графических процессоров, AMD собирается обеспечить более точный контроль, следовательно, улучшится энергоэффективность и параллельная обработка, потенциально повышая производительность за такт.

Большинство приложений оптимизировано под дизайн Nvidia. Создавая графическую архитектуру, которая может использовать все эти существующие оптимизации под NV, но добавляя свои собственные преимущества AMD, новые чипы Radeon могут стать настоящей проблемой для Nvidia.

Это должно сделать архитектуру AMD нового поколения одновременно более распараллеленной - а значит, потенциально более мощной - и ещё более эффективной, что и требуют поклонники Radeon.

Сейчас это все еще очень спекулятивно, и нет никаких конкретных намеков на то, что это действительно произойдет в GPU следующего поколения, вне зависимости от того, будет ли он под кодовым названием Arcturus. Но выбор времени имеет смысл - архитектура GCN становится довольно устаревшей, она была разработана в то время, когда 28-нм графические процессоры были в моде.

Сейчас речь идет о литографиях гораздо меньшего размера, и теперь есть потенциал для добавления большего количества логики в блоки графических чипов, уже возможно одновременно втиснуть их в нужном количестве. Это сделает их мощными и не превратит их в неоправданно большие и сложные для изготовления чипы по заоблачным ценам.

Источник: pcgamesn.com

#amd #navi #next-gen

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Популярные статьи