AGP 4X Fast Writes и первый GPU, использующий эту возможность (GeForce 256)

6 сентября 2006, среда 19:22
для раздела Блоги
Эта статья - всего лишь перевод. Но мне она понравилась. (Простите за ошибки в переводе. Что умею - тем и рады.)
Вспомнил, как, включая Fast Writes в BIOS ждал, что моя Riva TNT2 M64 будет работать быстрее ;-)



AGP 4X с "быстрой записью" (Fast Writes)

Краткий обзор
AGP 4X с "быстрой записью" - это уникальная возможность, встроенная в графический процессор GeForce 256 (и старшие). NVIDIA - это только поставщик, дающий возможность воспользоваться преимуществом, вообще же, "быстрая запись" - это часть спецификаций AGP 2.0. "Быстрая запись" ускроряет все команды записи с процессора на графическую чип, включая:
- Все 2D операции.
- Операции, включающие запись в кадровый буфер (видеопамять) или пересылку данных на графический чип.
- Загрузку текстур Direct3D в локальную память.
- Запись буфера в локальную видеопамять - с её помощью можно значительно увеличить производительность.

Как таковая, система с "быстрой записью" может значительно превосходить систему без оной.



В этой статье описывается принцип действия "быстрой записи" и преимущества от её использования.

Ныне действующая модель с RIVA TNT2
Нынешняя система, изображённая на рисунке ниже, обычно использует чипсет Intel 440 BX (AGP 2X) и системную память с частотой 100MHz. Графическая производительность этой системы ограничивается геометрической производительностью CPU.
Сам по себе, процессор может обрабатывать треугольники со скоростью 2 миллиона штук в секунду, что при средней их длине в 90 байт потребляет 180МБ/с пропускной способности - гораздо меньше, чем может позволить себе системная шина.

Таким образом, пропускная способность системной памяти не является узким местом.



Однако, следующее поколение 3D-приложений будет требовать в пять раз большей производительности при работе с треугольниками. Это подразумевает, что для данного размера треугольников (в терминах этой статьи - 90 байт-на-треугольник) требуется полоса пропускания в пять раз больше, т.е. 900MБ/с! Это больше полосы пропускания текущей системы.

Графическая система без функции "быстрой записи".
На рисунке ниже показана система следующего поколения, использующая чипсет Intel 820 (AGP 4X) и Direct RDRAM. С системной шиной 133MHz (1.06Гб/с) и системной памятью с пропускной способностью 1.6Гб/с, являющаяся в данном случае узким горлышком (когда требуется передача данных со скоростью 900МБ/с = или 1.8Гб/с, если сложить два потока).



В данном случае, графический контроллер не поддерживает "быструю запись". Это заставляет CPU простаивать в ожидании передачи данных через всю систему. Таким образом, с пропускной способностью памяти 1.6Гб/с, невозможно поддерживать постоянную скорость в 900МБ/с на чтение/запись системной памяти. Этот трешинг (режим интенсивной подкачки - возникает в том случае, если нет возможности разместить в оперативной памяти все рабочее множество процесса, например, если одновременно работает слишком много приложений) шины системной памяти также приводит к снижению общей системной производительности.
В следующей части объясняется, как графический процессор с "быстрой записью" устраняет эту проблему.

GeForce 256 с функцией "быстрой записи"
Функция "быстрой записи" позволяет CPU пересылать данные прямо на графическую шину в обход системной памяти. Это увеличивает системную производительность двумя способами:
1. Устраняет узкое горлышко, существовавшее в системе без "быстрой записи".
2. Освобождает шину системной памяти для выполнения других функций, что увеличивает эффективность системы.
На картинке ниже показано, как работает графический процессор GeForce 256 с функцией "быстрой записи".



"Быстрая запись" ускоряет все команды записи с процессора на графический чип, включая:
- Все 2D-операции.
- Операции, включающие запись в кадровый буфер (видеопамять) или пересылку данных на графический чип.
- Загрузку текстур Direct3D в локальную память.
- Запись буфера в локальную видеопамять - с её помощью можно значительно увеличить производительность.
Как результат, система с "быстрой записью" может значительно превосходить систему без оной.

"Быстрая запись" - почему её используют не на всех видеоадаптерах?
Как мы выяснили, AGP с "быстрой записью" значительно увеличивает производительность. Так почему не все используют эту возможность?
На этот вопрос есть простые ответы:
1. Функция "быстрой записи" - это архитектурная особенность. Ядра передовых графических процессоров должны быть собраны с поддержкой записи с CPU в режиме 4X, пока поддерживается совместимость с чипсетами, несовместимыми с "быстрой записью" (например, Intel 440BX).
2. "Быстрая запись" должна быть ограничена недосинхронизацией AC (ну... я не совсем понял о чём речь). Согласование таймингов AGP 4X без "быстрой записи" - это всегда тяжело. Но "быстрая запись" ещё больше усложняет проблему.

Так это доступно лишь картам NVIDIA? NVIDIA разработала свой северный мост с "быстрой записью" AGP (в соответствии со спецификациями AGP 2.0) и сейчас обкатывает его. Мы проверяем этот чип вместе с GeForce 256. Только мы являемся поставщиками графических решений с этой уникальной возможностью и мы получаем превосходство на всеми другими решениями на базе AGP 4X. NVIDIA вместе с Intel проверяют совместимость "быстрой записи" на чипсете Intel 820 (известного как "Camino").

Итог
- Контент следующего поколения будет нуждаться в пятикратном увеличении производительности с треугольниками и будет наполнять пропускную способность системной памяти.
- Графические контроллеры без "быстрой записи" будут ограничены полосой пропускания системной памяти, и процессор будет простаивать, что снизит производительность системы.
- GeForce 256 с "быстрой записью" решит эту проблему и значительно увеличит производительность системы.
- "Быстрая запись" - это уникальная способность GeForce 256, тк. требует очень сложных архитектурных усовершенствований и первоклассного мастерства разработчика.

_______________________________

Оригинальный документ на английском языке: http://developer.nvidia.com/attach/6633
Дата оригинального документа: 10 ноября 1999 года.
Оценитe материал

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают