Первые подробности об архитектуре Kepler и новые данные о быстродействии GK104

Несмотря на то, что до заветной даты официального анонса графических ускорителей поколения Kepler, отмеченной в календаре некоторых энтузиастов зелёным маркером, остаётся меньше одной недели, блюстители строгих правил NDA уже не в силах сдержать поток информации о новых продуктах NVIDIA. Благодаря интернет-изданию HKEPC, мы можем созерцать схематическое строение GPU GK104.

Прежде всего, разрешились споры о количестве ядер CUDA, которых действительно в три раза больше, нежели у процессора видеокарты GeForce GTX 580, и насчитывается 1536 штук. GK104 изготовлен по 28 нм техпроцессу, имеет площадь около 318 мм² (18.55 на 17.18 мм), а иерархия компонентов GPU претерпела некоторые изменения в сравнении с архитектурой Fermi.

Как театр, который начинается с вешалки, GK104 "начинается" с блока распределения потоков GigaThread Engine. Графический процессор включает в себя четыре кластера (GPC), которые сообщаются с общей кэш-памятью второго уровня (768 Кбайт) и 4 растровыми блоками (32 ROP). Каждый из GPC содержит два потоковых мультипроцессора, которые теперь именуются SMX.

В состав SMX входят:

  • улучшенный блок геометрии PolyMorph 2.0 (также содержит тесселятор);
  • кэш первого уровня (64 Кбайт), кэш инструкций и кэш текстур;
  • 4 планировщика для группы потоков данных Warp Scheduler;
  • 8 диспетчеров инструкций;
  • регистровый файл объёмом 128 Кбайт;
  • 192 ядра CUDA;
  • 32 блока специальных функций SFU;
  • 32 блока загрузки и сохранения данных LSU;
  • 16 блоков TMU.

Изменилась и система определения тактовых частот графического процессора. Мы с уверенностью можем сказать, что NVIDIA отказалась от дальнейшего использования концепции Hotclocks, подразумевающей двукратную разницу между частотой ядра GPU и шейдерного домена, в пользу технологии динамического регулирования в зависимости от нагрузки. Впрочем, имеющиеся слайды не дают возможности понять все хитрости нововведения.

Попробуем абстрагироваться от количественных данных, и перейдём к сравнению производительности GeForce GTX 680 с флагманом NVIDIA прошлого поколения GeForce GTX 580 и Челубеем из противоположного лагеря - Radeon HD 7970. Тесты проведены не самой NVIDIA и не одним из заинтересованных партнёров компании, а специалистами HKEPC, что даёт им право претендовать на объективность повествования.

Тестовый стенд был собран на основе материнской платы ASUS Rampage IV Extreme, в которую устанавливался процессор Intel Core i7-3960X (штатные частоты), 8 Гбайт оперативной памяти GeIL EVO 2 DDR3-2200 (4 модуля по 2 Гбайт). Сравнение производилось в бенчмарках 3DMark 2011 и Unigine Heaven (версия не уточняется), а также в компьютерных играх Battlefield 3, Batman: Arkham City, Call of Duty: Modern Warfare 3 и Lost Planet 2. Во всех случаях разрешение было установлено на 1920 на 1080 точек, а сглаживание - на 8x MSAA.

Судя по графику энергопотребления и температурному режиму, GeForce GTX 680 опережает Radeon HD 7970 по показателям энергоэффективности:

В продолжение темы о Kepler, вернёмся к новому алгоритму сглаживания, о котором мы упоминали вчера. Технология получила название TXAA и обеспечивает качество, сопоставимое с режимом 16x MSAA, при этом загружает GPU не сильнее, чем режим 2x MSAA. Кроме того, видеокарты поколения Kepler получат новую "адаптивную" технологию V-Sync и возможность выводить изображение сразу на 4 монитора без каких-либо дополнительных приспособлений.

Сглаживание TXAA существует в двух видах: TXAA1, который загружает GPU как 2x MSAA и обеспечивает изображение, по качеству сопоставимое с 16x MSAA; и TXAA2, при котором нагрузка на GPU сопоставима с 4x MSAA, но качество изображения значительно выше, нежели возможно при 16x MSAA.

Адаптивная технология вертикальной синхронизации позволяет ограничивать частоту кадров в тяжёлых сценах значением ниже, чем частота обновления экрана, пресекая тем самым вероятность возникновения каких-либо неприятных артефактов.

Наконец, кроме поддержки четырёх мониторов, новые GPU NVIDIA обучились технологии 3D Vision Surround, позволяющей выводить стереоскопическое изображение на три монитора.

Telegram-канал @overclockers_news - это удобный способ следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал
рейтинг: 4.4 из 5
голосов: 197

Возможно вас заинтересует

Сейчас обсуждают