Ретробенчмаркинг — GeForce GTX 280 (GT200)
реклама
Введение
В прошлой заметке, посвящённой бюджетному решению NVIDIA GeForce 9600 GT (G94), мы отмечали, что в начале 2008 года топовое одночиповое решение ATI/AMD в лице Radeon HD 3870 уже с большим трудом справлялось с конкуренцией даже в middle-end сегменте. Ну а с high-end ускорителями ситуация у компании была ещё хуже — если в промежутке от $150 до $300 различные варианты Radeon HD 3850/3870 за счёт постоянно снижаемых ATI/AMD цен могли составить неплохую конкуренцию продуктам NVIDIA, то желавшим получить большую производительность в 3D, пускай и жертвуя кошёльком, "красной компании" было особо нечего предложить. Формально у ATI/AMD имелось двухпроцессорные решения Radeon HD 3850/3870 X2, старшее из которых обходило не только своего ближайшего по цене конкурента NVIDIA в лице обновлённого GeForce 8800 GTS, но и более дорогие топовые ускорители GeForce 8800 GTX/Ultra. Здесь однако, не стоит забывать о том, что двухчиповое решения проигрывали по энергопотреблению и тепловыделению, а также требовали значительных затрат на оптимизацию драйверов и игровых приложений во избежание проблем с производительностью вроде плохой масшабируемости и пресловутых микростаттеров. И если крупные AAA-проекты разработчики обычно не обделяли вниманием в плане оптимизаций под multi-GPU системы, включая двухчиповые решения, то в не самых популярных играх наблюдались серьёзные проблемы. В сложившейся ситуации ATI/AMD безусловно нужно было как можно быстрее выпускать принципиально новые одночиповые ускорители, но NVIDIA вновь немного опередила конкурента, представив новое десятое поколение своих графических процессоров чуть раньше, в середине июля 2008. Первыми ускорителями новой 200-ой серии GeForce стали GTX 260 и 280, и сегодня мы поговорим о топовом решении новой линейки.
Произошедшее в 2007 году обновление архитектуры графических чипов NVIDIA можно считать минорным — как уже отмечалось ранее, новый чип G92 представлял собой чип G80, переведённый на 65-нм техпроцесс с незначительными архитектурными изменениями, затрагивавшими преимущественно лишь текстурные модули. Безусловно, переход на более тонкий техпроцесс позволил NVIDIA снизить себестоимость производства чипов и представить мощные решение в среднем ценовом сегменте, но в 2008 хотелось уже чего-то по-настоящему нового. И, надо сказать, NVIDIA не подвела, представив в июне 2008 года решения на базе нового видеочипа с кодовым наименованием GT200, в котором были реализовано уже значительно большее количество архитектурных изменений по сравнению с переходом от G80 к G92. Конечно, новый чип архитектурно отличался от своего предшественника G80 не так сильно, как G80 в своё время от G70, но оно и понятно — унифицированная шейдерная архитектура, хорошо зарекомендовавшая себя ранее была лишь несколько переработана и улучшена. Тем не менее достаточно серьёзные архитектурные изменения в чипе GT200 имелись, так что поговорить есть о чём.
реклама
Как мы отмечали в обзоре GeForce 8800 GTX, чипы унифицированной шейдерной архитектуры NVIDIA представляют собой массив устройств для вычислений над числами с плавающей точкой, так называемых потоковых процессоров (Streaming Processor, SP). Потоковые процессоры объединяются в потоковые мультипроцессоры (Streaming Multiprocessor, SM), которые являются независимыми устройствами выполнения инструкций, содержащими помимо потоковых процессоров ещё и более сложные устройства для вычисления значений трансцендентных функций и интерполяции пиксельных атрибутов (Special-Function Unit, SFU), а также устройство выборки и отправки инструкций на выполнения, кэш инструкций и констант и небольшой блок общей памяти. Потоковые мультипроцессоры в свою очередь объединяются в текстурно-процессорные кластеры (Texture/Processor Сluster, TPC), снабжённые блоками, выполняющими загрузку данных из памяти и выгрузку данных обратно в память.
В G80/G92 каждый кластер TPC объединял в себе 2 потоковых мультипроцессора, а всякий потоковый мультипроцессор SM включал в себя 8 потоковых процессоров SP и пару более сложных устройств SFU. Таким образом, полноценный чип G80, содержавший 8 кластеров TPC мог похвастаться 8×2×8 = 128 потоковыми процессорами. Идентичным образом был устроен и чип G92, а вот в GT200 внутренне устройство, напротив, было существенно изменено: во-первых, с 2 до 3 было увеличено число потоковых мультипроцессоров SM на каждый кластер TPC, а во-вторых, с 8 до 10 было увеличено число кластеров TPC в составе чипа. В итоге вместо 128 потоковых процессоров в распоряжении полноценного чипа GT200 имелось уже 10×3×8 = 240 потоковых процессоров, то есть почти вдвое больше, чем ранее! Количество текстурных модулей на кластер TPC осталось в сравнении с G92 без изменений — каждый TPC имел 8 модулей адресации текстур TA и 8 же модулей фильтрации текстур TF (в G80 модулей адресации было вдвое меньше). Однако, за счёт увеличения числа самих TPC суммарное число текстурных модулей в GT200 возросло с 64 до 80.
реклама
Обратите внимание, что увеличение числа вычислительных блоков в GT200 на внушительные 87.5% сопровождалось лишь незначительным ростом количества модулей фильтрации в 25%. Впрочем, в таком развитии унифицированной шейдерной архитектуры NVIDIA нет ничего неожиданного, так как компания лишь двигалась в направлении, задаваемом индустрией — год от года игры использовали всё более сложные шейдеры, так что производительность уже более не ограничивалась скоростью текстурирования, как это зачастую было в прошлом.
Широких блоков растеризации, каждый из которых обрабатывал по-прежнему по четыре пикселя за такт, также стало больше — в G80 их было 6, в G92 их количество было уменьшено до 4, а в GT200, напротив, увеличено до 8. Итоговая конфигурация полноценного чипа GT200, таким образом, в формате SPs:TMUs:ROPs выглядела как 240:80:32, в то время как G80 и G92 имели конфигурацию 128:32:24 и 128:64:16, соответственно.
Уже вышеописанных изменений было бы достаточно, чтобы вывести 3D-ускорители на новый уровень производительности даже с учётом того факта, что частоты вычислительных блоков в GTX 280 были понижены по сравнению с предыдущими решениями из-за возросшего энергопотребления и тепловыделения нового значительно более сложного чипа, производившегося по старой 65-нм технологии. Но NVIDIA не ограничилась одним лишь увеличением числа исполнительных блоков, как это можно видеть даже из краткого сравнения характеристик в таблице выше. Сразу же бросается в глаза ещё более широкая 512-битная шина памяти и увеличенный до 1 ГБ её объём.
реклама
Но и это ещё отнюдь не всё, так как помимо лежащих на поверхности количественных изменений, NVIDIA внесла в GT200 множество более мелких микроархитектурных оптимизаций, из которых безусловного упоминания заслуживают как минимум следующие.
- Было значительно увеличено число одновременно обрабатываемых чипом потоков. Каждый мультипроцессор SM в GT200 мог планировать выполнение до 1024 потоков, так что весь чип, имевший в наличии 30 мультипроцессоров, мог исполнять 30720 потоков. В G80/G92 эти цифры были заметно скромнее — 768 потоков на один мультипроцессор SM и 12288 на весь чип.
- Был вдвое увеличен размер регистрового файла каждого мультипроцессора.
- Были значительно улучшены возможности по одновременному исполнению двух инструкций. Пресловутый режим работы "dual issue MAD+MUL", о котором мы подробно писали в заметке, посвящённой GeForce 8800 GTX, наконец-то стал реальностью.
- Была добавлена поддержка вычислений двойной точности. Потоковые процессоры в GT200 по-прежнему умели выполнять операции лишь над числами одинарной точности (FP32), но каждый мультипроцессор был дополнительно снабжён блоком для вычислений с двойной точностью, столь важных для различных неграфических расчётов.
В результате множества количественных и качественных изменений, эффективность унифицированной шейдерной архитектуры в GT200 было значительно увеличена. И в синтетических тестах, и что куда важнее, в реальных игровых тестах новый топовый ускоритель NVIDIA значительно опережал по скорости одночиповые варианты прошлых лет, иногда до двух раз и даже более! Ниже для примера приведены сводные диаграммы результатов сравнения производительности GeForce GTX 280 и GeForce 9800 GTX, отличавшейся от GeForce 8800 GTS (G92) лишь чуть более высокими частотами.
реклама
В среднем GeForce GTX 280 на старте продаж была быстрее, чем GeForce 9800 GTX на 45% в HD-разрешении и на 66% в FHD. А теперь давайте посмотрим, как выглядит ситуация спустя многие годы (а также многие версии Windows и графических драйверов) в самых передовых игровых проектах, поддерживавших DX10-ускорители. Поможет нам в этом карточка GV-N28-1GH-B от GIGABYTE, остальные компоненты тестового стенда остались без изменений:
- Материнская плата GIGABYTE Z390 GAMING SLI.
- Процессор i5-9600K в небольшом разгоне до 4.8 ГГц на все 6 ядер под недорогой СЖО ID-Cooling AURAFLOW X 360.
- Оперативная память 2x16 ГБ Ballistix Sport LT (BLS16G4D32AESE), разогнанная до 3733 МГц с первичными таймингами 16-20-20-40.
- Windows 10 2004, установленная на SSD WD Blue SN550, игры — на HDD Seagate Barracuda 3 TB ST3000DM008.
GeForce GTX 280 — длинная и тяжёлая карта с весьма сложной печатной платой. Запросы по питанию (2 дополнительных разъёма 6-пин + 8-пин, минимум 40 A по 12 В линии блока питания) и тепловыделение (TDP 236 Вт) у карточки также немаленькие. Система охлаждения, схожая с таковой у GeForce 8800 GTS (G92), только с чуть большим по размеру радиатором условно справляется даже спустя многие годы. Говорю "условно", так как в стресс-тесте FurMark температура графического процессора даже на открытом стенде переваливает за 90 °C. С одной стороны, до максимальной температуры в 105 °C даже в стресс-тестах дело не дошло, с другой — даже 90 °C на открытом стенде это всё же очень горячо. И ни разу не тихо. Охладить пыл почти полутора миллиардов транзисторов — не шутки!
Тесты
Unigine Tropics
3DMark Vantage
3DMark Cloud Gate
В нашем наборе синтетических тестов GeForce GTX 280 суммарно обошла GeForce 8800 GTS (G92) на 58% в HD-разрешении и на 77% в FHD. GeForce 8800 GTX смотрится в синтетике чуть увереннее, поэтому и цифры превосходства GeForce GTX 280 над ней чуть меньше — 55% и 63% в HD и FHD, соответственно.
Call of Juarez (Chrome Engine 3, 2007)
Crysis (CryEngine 2, 2007)
Far Cry 2 (Dunia Engine, 2008)
S.T.A.L.K.E.R. Call of Pripyat (X-Ray Engine 1.6, 2009)
Metro 2033 (4A Engine, 2010)
Total War Shogun 2 (TW Engine 3, 2011)
Sniper Elite V2 (Asura Eingine, 2012)
Hitman Absolution (Glacier 2, 2012)
BioShock Infinite (Unreal Engine 3, 2013)
Tomb Raider (Crystal Engine, 2013)
F1 2014 (EGO Engine, 2014)
Grand Theft Auto V (RAGE, 2015)
Среднегеометрические результаты
В реальных играх превосходство GeForce GTX 280 над предыдущими одночиповыми топами NVIDIA выглядит чуть менее впечатляюще — GeForce 8800 GTS (G92) новинка обходит на 27–45% и 45–100% в HD- и FHD-разрешениях, соответственно, а превосходство над GeForce 8800 GTX в тех же разрешениях составило 36–50% и 50–67%.
Выводы
- Новое топовое одночиповое решение NVIDIA получилось очень мощным, обходившим в высоких (на момент выхода) разрешениях предыдущие одночиповые ускорители этой компании в 1.5–2 раза. Если G92 в сравнении с G80 выдавал практически туже производительность за меньшие деньги, то есть стал прорывом по соотношению цена/производительность, то GT200 предлагал совершенно новый уровень производительности, пускай и за дорого.
- Что касается цены, то, конечно же, как и любой продукт high-end сегмента, GTX 280 даже по рекомендованной цене в $650, не могла похвастаться хорошим соотношением цена/производительность. Но ведь любые топовые железки покупают совсем не за этим.
- Из других недостатков стоит отметить так же высокое энергопотребление и тепловыделение новинки, приводившие к серьёзному нагреву (а нередко отвалу графического чипа) и высокому уровню шума в нагрузках.
- Топовый одночиповый продукт конкурента в лице Radeon HD 3870 безнадёжно отставал от новинки NVIDIA — в наших игровых тестах GeForce GTX 280 оказался быстрее на 48–96% в HD-разрешении и 78–150% в FHD. ATI/AMD нужно было срочно выпускать на рынок достойный одночиповый ответ, так как технологический отрыв решений конкурента стал уже просто колоссальным.
- Да, в арсенал ATI/AMD, как, впрочем, и самой NVIDIA, имелись двухчиповые ускорители, способные потягаться с GeForce GTX 280 по производительности и стоившие при этом дешевле, однако, двухчиповые решения, как мы уже отмечали, зачастую проигрывали по энергопотреблению и тепловыделению, а также не всегда хорошо масштабировались и страдали от микростаттеров.
Предыдущие обзоры
- GeForce 8800 GTX (G80)
- GeForce 8800 GTS (G80)
- Radeon HD 2900 XT (R600)
- GeForce 8800 GT (G92)
- GeForce 8800 GTS Core 112 (G80)
- Radeon HD 3870 (RV670)
- GeForce 8800 GTS (G92)
- GeForce 9600 GT (G94)
реклама
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила