Эволюция архитектур видеокарт nVidia
реклама
Помимо корпоративной легенды NVIDIA, есть совпадающая с ней точка зрения журналистов сайта Firingsquad, где совсем недавно была опубликована статья "История NVIDIA", и оппозиционное мнение легендарного программиста id Software Джона Кармака johnc@idsoftware.com.
Firingsquad: "Выпущенный в 1995 году, NV1 и его модификация STG2000 были первыми "полными" мультимедиа-ускорителями. Оба чипа были идентичны за исключением того, что NV1 использовал высокопроизводительную VRAM, а STG2000 - более дешевую DRAM. Несмотря на то, что NV1 был первым продуктом NVIDIA, для свого времени он был весьма продвинутым решением: 2D- и 3D-графика, встроенный аудиопроцессор мощностью 350 MIPS и процессор ввода-вывода. Самой известным ускорителем на основе NV1 был Diamond EDGE 3D.
Когда чип NV1 был только представлен, многие из 3D-стандартов, которые сейчас кажутся непререкаемыми, еще принимались. Пока полигоны не были окончательно утверждены в качестве стандарта для 3D-игр, NVIDIA решила использовать другой способ формирования примитивов объемного изображения - Quadratic Texture Maps (кривые поверхности третьего порядка). Тогда как современным 3D-ускорителям требуется большое количество маленьких полигонов для воспроизведения гладкой поверхности, в NV1 использовались искривленные стороны полигонов. Это позволяло чипу отображать гладкие поверхности без особой нагрузки. Текстуры хранились в системной памяти и подавались через шину PCI или VESA Local Bus по мере необходимости - по тому же принципу через несколько лет будет работать AGP.
Однако первый продукт NVIDIA не состоял целиком из графического ядра. В NV1 была интегрирована микросхема для воспроизведения звука. С 32 каналами, 16-битным CD-качеством и аппаратным ускорением примитивного объемного звука, NV1 производила более сильное впечатление, чем многие PCI звуковые карты первого поколения. В качестве банка для MIDI (таблица MIDI была сертифицирована Fat Labs) использовалось 6 МБ системной памяти.
Вместо традиционного игрового порта на NV1 был размещен разъем, поддерживающий геймпады и джойстики от Sega Saturn, которые можно было использовать в любой совместимой с DirectInput игре, включая Virtua Fighter, Virtua Cop и Panzer Dragoon.
Хотя чип NV1 намного превосходил возможности конкурентов и был значительно перспективней, именно технология кривых поверхностей третьего порядка привела к его рыночной смерти. Когда Microsoft утвердила спецификации Direct3D, незадолго после того, как NV1 появился на полках магазинов, именно полигоны были выбраны в качестве стандартных примитивов. И, несмотря на все усилия NVIDIA и Diamond, разработчики больше не хотели ориентироваться на NV1. Компания Diamond даже пыталась увеличить число покупателей огромными скидками и включением в комплект поставки геймпада от Sega, но и это не принесло успеха.
С помощью Direct3D Microsoft практически уничтожила NVIDIA. Производители ПК отказывались ставить в машины видеокарты на чипе, несовместимом с Direct3D, и инженеры NVIDIA понимали, что не смогут вывести на рынок новый полигональный 3D-ускоритель. Компания ушла от общественного интереса и была вынуждена уволить несколько сотрудников.
NV5:
Чип: nVidia Riva TNT2 (TNT2 Vanta, TNT2 M64, TNT2 Pro);
Технологический процесс: 0,25 микрон (0,22 микрон у TNT2 Pro);
Архитектура чипа 128 бит;
Разрядность интерфейса памяти 128 бит (64 бит у TNT2 Vanta и TNT2 M64)
Разрядность шины данных 128 бит (64 бит у TNT2 Vanta и TNT2 M64)
Пропускная способность памяти 2,4 Гб/сек., ( 1,2 Гб/сек у TNT2 Vanta и TNT2 M64; 2,65 Гб/сек. у TNT2 Pro)
Интерфейс AGP 4X (режим Fast Writes не поддерживается);
Частота работы ядра 125 МГц, (100 МГц у TNT2 Vanta, 125 МГц TNT2 M64 и 142 МГц у TNT2 Pro)
Частота работы памяти 150 МГц, (125 МГц у TNT2 Vanta, 150 МГц TNT2 M64 и 166 МГц у TNT2 Pro)
Тип памяти SDR / SGR;
Максимальный объем видеопамяти: 32 Мб;
Конвейеров рендеринга: 2, с двумя блоками текстурирования на каждый;
Скорость заполнения при мультитекстурировании: 125 Мпикселей/сек., 250 Мтекселей/сек., (100 Мпикселей/сек., 200 Мтекселей/сек. у TNT2 Vanta, 125 Мпикселей/сек., 250 Мтекселей/сек. у TNT2 М64 и 142 Мпикселей/сек., 284 Мтекселей/сек. у TNT2 Pro);
Нет аппаратной поддержки T&L;
NV10:
15 миллионов освещённых, рассчитанных, отсечённых и затекстуренных полигонов в секунду.
Наложение до 4 пикселов за такт (4 пиксельный конвейер)
Скорость заполнения в 480 миллионов пикселей в секунду с 32 элементами текстур за такт и 8-tap анизотропной фильтрацией.
Аппаратная поддержка стандартных для DirectX7 восьми источников освещения
350 MHz RAMDAC
Полная поддержка DX7 и OpenGL - Transform & Lighting, Кубическое текстурирование с использованием шаблонов окружения, процедурное текстурирование и сжатие текстур.
Полная утилизация 4x AGP с функцией "Fast Writes", что позволит центральному процессору отправлять данные прямо графическому ядру на скорости около 1Гб в секунду.
256 битное ядро
Поддержка проигрывания HDTV (High Definition Television) с максимальным качеством
NV15:
0.18 микрон;
Частота чипа ожидается в районе 160 - 200 МГц;
Частота памяти от 183 МГц до 200 МГц для SDR и от 333 МГц до 400 для DDR;
Поддержка памяти SDR, DDR SDRAM/SGRAM;
Внутрення шина памяти 128 и 256 бит;
До 128 Мб памяти;
Производительность в режиме мультекстурирования 640-800 млн. пикселей (Ge Force 256 - 240 млн. пикселей);
RAMDAC 350 МГц;
PCI 2.2 и AGP x4 (включая режим Fast Writes);
Поддержка HW T&L, FSAA, HDTV процессор, edge anti-aliasing (краевое сглаживание)
NV20:
Технология: 0.15 мкм
около 60 миллионов транзисторов
Частота графического ядра: 200+ МГц (позже, вероятны "Ultra" и "Pro" варианты, например на 250 МГц)
Число пиксельных конвейеров рендеринга: четыре
Число текстурных блоков на конвейер рендеринга: два
Возможность наложения четырех текстур на один пиксель (требуется два такта)
Интерфейс памяти: 128 бит
Поддерживается память типа DDR SDRAM/SGRAM
Пиковая пропускная способность шины памяти при 250 Мгц шине: 8 Гб/с
Поддерживаемый объем локальной видеопамяти: до 128 Мб (первые карты, как и наш образец, будут иметь 64 Мб)
RAMDAC: 350 МГц
Максимальное разрешение: 2048x1536@75Hz
Аппаратный T&L: эффективная производительность порядка 40+ млн. полигонов в секунду (у нашего образца чуть меньше 40 млн. полигонов в секунду на синтетическом тесте)
NV25:
6 пиксельных конвейеров рендеринга
частота ядра - 300MHz
частота памяти - 600MHz, полоса пропускания - 10.5GB/sec
поддержка TwinView
аппаратная поддержка декодирования MPEG-2
улучшенный модуль T&L, алгоритмы сглаживания
технология производства - 0.13микрон.
63 млн транзисторов (только на 3 млн больше GeForce3);
Изготовитель: TSMC по 0,15 мкм техпроцессу;
T&L производительность: 75-100 млн вершин/с;
128 Мб кадровый буфер по умолчанию;
Движок nFiniteFX II;
Сглаживание Accuview;
Архитектура памяти Lightspeed II;
nView.
NV30:
73 миллиона транзисторов
0.13-мкм технологический процесс;
частота ядра - 450 МГц;
поддержка AGP 8x;
8 конвейеров рендеринга;
4 блока вертексных шейдеров;
2 блока пиксельных шейдеров;
Lightspeed Memory Architecture III (в продолжение LMA II в GeForce4);
двойной Z-Buffer;
новый метод анизотропной фильтрации под названием "12nvx";
поддержка Glide;
отдельный процессор T&L, работающий на тех же 450 МГц (помните 3dfx с ее отдельным T&L-процессором Sage? Между прочим, все специалисты из этой компании до сих пор трудятся в NVidia);
256-битный доступ к памяти, имеющей частоту в 750 МГц (DDR), то есть пиковая пропускная способность памяти составляет 24 Гбайт/с
NV35:
CineFX Shading Architecture;
пиксельные шейдеры v. 2.0;
вершинные шейдеры v. 2.0;
до 12 операций с пиксельными шейдерами за такт;
пиксельные программы - до 1024 инструкций;
до 256 статических инструкций в одной вершинной программе, до 65 536 выполняемых инструкций;
динамическое исполнение и контроль потока;
256-битный интерфейс памяти с контроллером памяти следующего поколения;
128-битная точность вычислений с поддержкой 32-битного, 64-битного и 128-битного цвета;
до 16 текстур за проход;
поддержка формата текстур sRGB;
поддержка технологий Intellisample, Hi-Res compression (HCT);
Shadow Volume Accelerator (ускорение расчёта объёмных теней);
технология nView;
встроенный NTSC/PAL TV-энкодер с поддержкой разрешения до 1024x768;
поддержка Microsoft Video Mixing Renderer (VMR);
декодирование DVD и HDTV MPEG-2;
два встроенных 400 MHz RAMDAC с поддержкой разрешения до 2048x1536 @ 85 Hz;
два DVO порта для TMDS трансмиттеров и внешних ТВ-энкодеров;
два встроенных TMDS трансмиттера с возможностью вывода изображения на LCD панель в разрешении большем чем 1600x1200;
Digital Vibrance Control 3.0;
0.13 мкм процесс;
упаковка BGA 1309 40 ? 40 мм;
поддержка Comprehensive Microsoft DirectX® 9.0 и OpenGL 1.4;
Про современные архитектуры подробнее:
NV40:
Наиболее массовым семейством графических процессоров компании NVIDIA в настоящее время, является серия NV4x. Именно благодаря очень удачным чипам этой серии, калифорнийский гигант сумел не только выправить свое положение на рынке, подорванное провалом предыдущей линейки NV3x, но и продемонстрировать всему миру устойчивые тенденции роста, особо заметные на фоне определенных неудач, постигших ATI в последние месяцы.
Флагманской моделью линейки NV4x является чип NV40, увидевший свет в апреле 2004 года. Он производится по хорошо отработанному, но стремительно устаревающему 130-нм техпроцессу на заводах IBM, его 222 миллиона транзисторов потребляют до 120 Ватт энергии, поэтому "силовых" возможностей штатного интерфейса AGP 8x уже катастрофически не хватает и на видеокартах, изготовленных на базе NV40, обычно устанавливают по два (!) дополнительных разъема питания. Да и система охлаждения всей этой "печки" должна быть не самой слабой. Наряду с NV40, выпускается и его PCI Express-модификация NV45, все отличие которой от базовой модели, заключается в интегрированном в корпус чипа AGP-PCI-E мосте HSI. В производственной линейке NVIDIA встречается еще и чип NV48, который отличается от базового NV40 только тем, что выпускается на фабриках TSMC. Таким образом, NVIDIA целиком и полностью отказалась от услуг IBM в области изготовления чипов, и вернулась к своему старому и, видимо, более приемлемому, чем IBM, технологическому партнеру.
256 битный четырехканальный (организация 64х4) интерфейс памяти NV40 обеспечивает подключение до 1 Гбайта памяти любого типа - как обычной DDR1/DDR2, так и специально разработанной для использования в видеоустройствах GDDR3. Что касается архитектурных особенностей NV40, то стоит отметить, что он стал первым графическим процессором, возможности которого полностью соответствуют требованиям DirectX 9.0с, иными словами, его вычислительные возможности позволяют выполнять шейдеры версии SM (Shader Model) 3.0. Высокую производительность обеспечивают 6 вершинных и 16 пиксельных конвейеров (каждый из которых, в свою очередь, оборудован двумя шейдерными блоками и одним блоком текстурирования). Одновременно могут работать либо два шейдерных блока, либо текстурный и один из шейдерных блоков. Таким образом, NV40 позволяет выполнить за такт до 16 текстурных операций или 32 операций с глубиной и буфером шаблонов, обеспечивая анизотропную фильтрацию с соотношением сторон до 16:1 включительно.
На базе ядра NV40/NV45/NV48 выпускаются видеокарты: GeForce 6800 Ultra, GeForce 6800 GT, GeForce 6800 и GeForce 6800 LE. Типовые значения частоты ядра/шины памяти GeForce 6800 Ultra составляют 400 МГц/1,1 ГГц, у модификации GeForce 6800 GT они снижены до 350 МГц/1 ГГц, у GeForce 6800 - до 325 МГц/700 МГц, а у GeForce 6800 LE частотные параметры не оговорены вообще - все отдано на усмотрение производителей видеокарт. При этом у последних двух еще и уменьшено до 12 количество пиксельных конвейеров. Причем, в отличие от общепринятой практики, когда "урезание" осуществляется путем программного отключения некоторого числа процессоров (что дает возможность народным "умельцам" путем нехитрой операции подключить неиспользуемые блоки, получив, таким образом, полнофункциональную GeForce 6800 за небольшие деньги), в данном случае компания NVIDIA выпустила специальное "усеченное" ядро NV41. В нем имеется всего лишь 12 "физических" пиксельных процессоров, тогда как все остальное полностью соответствует базовому NV45. Ядро NV42 является 110-нм версией NV41. Кстати, именно оно лежит в основе самой последней новинки NVIDIA - GeForce 6800 GS (частота чипа - 425 МГц, памяти - 1000 МГц), призванной составить конкуренцию ATI Radeon X1600 XT.
Для видеокарт среднего уровня, компания NVIDIA в августе 2004 года выпустила графическое ядро NV43, являющееся, впрочем, несколько упрощенным (путем уменьшения числа вершинных и пиксельных процессоров и каналов контроллера памяти) решением, основанным на архитектуре NV40. Однако NV43 выполнен по 0,11-мкм технологии TSMC (количество транзисторов в ядре составляет 146 млн.), и, кроме того, он стал первым графическим ядром NVIDIA с встроенным контроллером PCI Express (возможна трансляция интерфейса PCI-E в APG 8х с помощью двустороннего PCI-E-AGP моста HSI). Благодаря более "тонкому" технологическому процессу и меньшему количеству исполнительных устройств в ядре, тепловыделение NV43 не превышает 70 Вт, то есть на PCI-Express карте разъем для дополнительного питания не нужен.
Набор вычислительных ресурсов NV43 ровно вдвое меньше, чем у старшей модели NV40 - он оснащен восемью пиксельными конвейерами и тремя вершинными, а ширина шины памяти уменьшена с 256 до 128 бит.
В настоящее время представлено две Mainstream-модификации видеокарт, базирующихся на графическом процессоре NV43 - GeForce 6600 и GeForce 6600 GT, а также одна класса Low-End - GeForce 6200 (впрочем, с недавних пор она переименована в GeForce 6600 LE). Частоты ядра и шины памяти GeForce 6600 составляют 300 и 550 (иногда - 500) МГц, а у модификации GT - 500 и 1000 МГц соответственно. В GeForce 6200/6600 LE используется "усеченное" ядро NV43V с четырьмя (вместо пиксельными конвейерами, а его частотный диапазон соответствует GeForce 6600.
Благодаря достаточно высокой тактовой частоты чипа, несмотря на всего лишь 8 пиксельных конвейеров рендеринга, NV43 обеспечивает филлрейт даже больший, нежели 12 конвейерный GeForce 6800. Однако реально достичь уровня производительности своего "старшего товарища" GeForce 6600 GT не дано - сказывается и использование 128-битной шины памяти и уменьшение до 3 числа вершинных процессоров, хотя все это и позволило заметно удешевить 6600-ю серию. Поэтому совсем неудивительно, что видеокарты на чипах GeForce 6600 GT и, особенно, GeForce 6600, сегодня демонстрируют наилучшее соотношение "цена/производительность".
В младшей модели семейства графических процессоров NVIDIA GeForce 6x00 - GeForce 6200ТС используется преимущественно ядро NV44, изготовленное по 0,11-мкм проектным нормам. Как и в случае NV43, PCI Express у него нативный (то есть реализованный на чипе), а AGP 8х вариант чипа обозначается как NV44А. NV44 имеет 3 вершинных процессора, как у NV43, и 4 пиксельных, какие-либо глобальные архитектурные отличия от NV40 и NV43 отсутствуют.
Главным ограничителем производительности у NV44, является подсистема памяти - ширина шины ограничена 64-битами. Индекс TC обозначает поддержку технологии TurboCache, призванная задействовать часть системной памяти при рендеринге буфера кадра, благо, пропускной способности шины PCI-E x16 для этого хватает. Конечно, такие видеокарты заметно проигрывают по уровню производительности своим полноценным собратьям, зато немного выигрывает у них по стоимости. А для бюджетных решений, каждый сэкономленный доллар может оказаться решающим в деле продвижения на рынок решений той или иной конкурирующих фирм. Тем не менее, для того, кто захочет немного сэкономить, приобретя такую видеокарту, такой выигрыш окажется иллюзорным. Ведь системная память, в особенности DDR2, от которой "оттяпывает" свою часть видеосистема, отнюдь не безразмерна и далеко не бесплатна.
G 70:
Середина лета 2005 года стала новой вехой в истории компании NVIDIA - был выпущен графический процессор нового поколения G70. Но, несмотря новое кодовое название чипа, его архитектуру нельзя считать принципиально новой - он является очередным этапом эволюции хорошо знакомой всем нам архитектуры семейства NV4x (о чем свидетельствует первоначальное кодовое обозначение чипа - NV47).
Плюс к этому, NVIDIA не стала рисковать и выпустила его по хорошо отработанному 110-нм техпроцессу TSMC, поэтому нет ничего удивительного в том, что видеокарты семейства GF7800GTX стали доступны в массовых количествах сразу после анонса.
Основным новшеством G70, базирующемся на все том же наборе шейдеров Shader Model 3.0 (SM 3.0), стало увеличение до 24 (или, по терминологии NVIDIA, до 6 процессоров квадов) числа слегка улучшенных, по сравнению с NV4x, пиксельных процессоров, а вершинных - до 8, объем адресуемой памяти типа GDDR3 может достигать 1 Гбайт. Кроме того, была осуществлена оптимизация питания и энергопотребления, благодаря чему типовое потребление видеокарты GeForce 7800 GTX не превышает 110 Ватт, то есть осталось на уровне GeForce 6800 Ultra, несмотря на 30% увеличение числа транзисторов. В G70 появилась аппаратная поддержка ряда потенциальных "хитов" ближайшего будущего: воспроизведение видео в формате HDTV, а также поддержка важных специальных возможностей графической драйверной модели Windows Vista. Кроме High-End видеокарты GeForce 7800 GTX (430/1200 МГц), процессор G70 устанавливается и в его чуть более скромном собрате - GeForce 7800 GT, отличающимся от GTX не только пониженными (до 400/1000 МГц) частотами, но и урезанным числом конвейеров (20 пиксельных и 7 вершинных) рендеринга, что обеспечивает ему место (по показателям производительности) где-то посередине между GeForce 7800 GTX и GeForce 6800 Ultra.
Очередными новыми чипами NVIDIA должны стать G72 и G74 (официальные названия GeForce 7600 и GeForce 7200), которые следует ожидать в феврале-марте 2006 года. Они, скорее всего, будут урезанными версиями базового G70, и станут первыми графическими чипами NVIDIA, выпускаемыми по 0,09 мкм технологии. Они должны заменить NV43 и NV44 в Mainstream- и Low-End секторах соответственно. Таким образом, в ближайшие полгода NVIDIA собирается полностью заменить все чипы NV4x на новинки из линейки G7x. Кроме того, NVIDIA в начале 2006 года планирует представить чип G71, являющийся 0,09 мкм версией G70 с меньшей площадью кристалла и пониженным энергопотреблением.
реклама
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Сейчас обсуждают