GeForce GTX 460 1 Гбайт против старой гвардии (часть 2)

Сравнение GF104 с G92b и GT200b
2 октября 2010, суббота 03:00
Zik для раздела Лаборатория

Оглавление

Продолжение. Начало - тут.

Вступление

Как показали результаты первой части, GeForce GTX 460 является очень мощной видеокартой в своем ценовом классе, однако некогда сильнейшие представители топсегмента – GeForce 9800GX2 и GeForce GTX 260 216 sp также выступили исключительно с положительной стороны, причём иногда наступая новичку на пятки.

Поскольку все участники прошедшего тестирования работали на разных тактовых частотах, было решено прогнать их в тех же приложениях, но при этом напрямую сравнив именно GPU данных видеокарт, установив одинаковые тактовые частоты для ядра и шейдерного домена, и вдобавок одинаковую пропускную способность для видеопамяти. Таким образом, участники тестирования обладали идентичными частотными характеристиками и могли бы продемонстрировать “чистые результаты”.

В качестве трёх основных видеокарт, представляющих разное поколение графических процессоров, выступят GeForce 9800 GTX 512 Мбайт, GeForce GTX 260 216 sp 896 Мбайт и GeForce GTX 460 1 Гбайт.

Рассматриваемые GPU и видеокарты на их основе

G92b и GeForce 9800 GTX

Видеочип G92b является настоящим долгожителем – видеокарты с ним выпускаются до сих пор, хотя уже в октябре ему стукнет три года. GPU с таким долгим сроком службы надо еще поискать – не многие дожили до такого почётного возраста, не будучи снятыми с производства.

Начав свою карьеру с урезанного варианта для GeForce 8800 GT, он вскоре прописался в GeForce 8800 GTS 512 Мбайт и GeForce 8800 GS, которые потом успешно были переименованы соответственно в GeForce 9800 GTX и GeForce 9600 GSO.

Сегодняшний игрок начального уровня среднего класса – GeForce GTS 250 хоть и лишен поддержки DirectX 11, но всё ещё успешно конкурирует с Radeon HD 5670, а в некоторых случаях даже с Radeon HD 5750. Следует учитывать что в ближайшие месяцы чип будет снят с производства (если eще не снят), ведь буквально на днях Nvidia анонсировала его долгожданную замену – GeForce GTS 450.

Процессор G92b содержит 8 мультипроцессоров, по 16 потоковых процессора в каждом.

Характеристики G92b (GeForce 9800 GTX)

  • Техпроцесс – 55 нм;
  • Кол-во транзисторов – 754 млн;
  • Мультипроцессоры – 8 (по 32 потоковых процессора в каждом);
  • Потоковые процессоры – 128;
  • Текстурные блоки – 64;
  • Блоки растровых операций – 16;
  • Тип видеопамяти – DDR3;
  • Шина данных – 256 бит;
  • Пропускная способность памяти – 70,5 Гбит/с (при тактовой частоте vRAM 2200 МГц).

GT200b и GeForce GTX 260 216

На момент анонса в середине 2008 года этот GPU был самым мощным монолитным видеочипом, по числу исполнительных блоков практически вдвое опережавшим аналогичные характеристики G92b. Он был урезан по количеству потоковых, текстурных и растровых блоков, дав жизнь сначала GeForce GTX 260 192 sp, а потом и GTX 260 216 sp, GTX 275 и GTX 295. Однако из-за высокой стоимости производства такого большого чипа начальная цена на видеокарты семейства GTX оставляла желать лучшего. Уже через месяц после анонса NVidia немного подкрутила ценник, сделав его более адекватным для конкуренции линейке Radeon HD 4800, но из-за первоначально завышенной цены продажи новых видеокарт первое время были не такими большими, как хотелось бы производителю.

Процессор G200b содержит 10 мультипроцессоров по 24 потоковых процессора в каждом. У GeForce GTX 260 216 активны лишь 9 из них, а у GTX 260 192 – 8.

Характеристики G200b (GeForce GTX 260 216)

  • Техпроцесс – 55 нм;
  • Кол-во транзисторов – 1400 млн;
  • Мультипроцессоры – 9 (из 10) (по 24 потоковых процессора в каждом) ;
  • Потоковые процессоры – 216 (из 240);
  • Текстурные блоки – 72 (из 80);
  • Блоки растровых операций – 28 (из 32);
  • Тип видеопамяти – DDR3;
  • Шина данных – 448 бит;
  • Пропускная способность памяти – 112 Гбит/с (при тактовой частоте vRAM 2000 МГц).

GF104 и GeForce GTX 460

Выпущен как недорогая и достаточно мощная замена предыдущему поколению видеокарт семейства GeForce GTX 260. У данной видеокарты работают не все мультипроцессоры, один из них отключён. Как скоро появится версия с полноценными 384 потоковыми процессорами пока неясно.

Всего чип GF104 содержит 8 мультипроцессоров по 48 потоковых процессоров в каждом. Примечательно, что версия GTX 460 768 Мбайт обладает только 24 блоками ROP’s. А вот её гигабайтная сестра получила все 32 блока ROP’s - в ее чипе отключены только шейдерные процессоры и текстурные блоки, растровые блоки остались работоспособными.

Характеристики GF104 (GeForce GTX 460 1 Гбайт)

  • Техпроцесс – 40 нм;
  • Кол-во транзисторов – 1950 млн;
  • Мультипроцессоры – 7 (из 8) (по 48 потоковых процессоров в каждом);
  • Потоковые процессоры – 336 (из 384);
  • Текстурные блоки – 56 (из 64);
  • Блоки растровых операций – 32;
  • Тип видеопамяти – DDR3;
  • Шина данных – 256 бит;
  • Пропускная способность памяти – 115 Гбит/с (при тактовой частоте vRAM 3600 МГц).

Уравнивание частот и пропускной способности

Прежде чем приступить к тестированию, мы взглянем на заводские характеристики GPU:

  G92b (9800 GTX) G200b (GTX 260) GF104 (GTX 460)
Частота GPU, МГц 675 575 675
Частота шейдерного домена, МГц 1688 1240 1350

Видно, что у G92b самые высокие частоты, а у G200b – самые низкие. Дабы уровнять участников, для всех GPU были установлены одинаковые показатели тактовых частот – 675/1400 МГц.

  GeForce
9800 GTX
GeForce
GTX 260
GeForce
GTX 460
Частота видеопамяти, МГц 2200 2000 3600
Разрядность шины памяти, бит 256 448 256
Итоговая пропускная способность, Гбит/c* 70,4 112 115

*Пропускная способность памяти считается по формуле: (частота видеопамяти * разрядность шины памяти / 8000).

Таким образом, для достижения одинаковой пропускной способности необходимо сделать даунклок тактовых частот памяти двух видеокарт до значений GeForce 9800 GTX:

  GeForce
9800 GTX
GeForce
GTX 260
GeForce
GTX 460
Частота видеопамяти, МГц 2200 1252 2200
Разрядность шины памяти, бит 256 448 256

Для всех тестируемых плат была установлена пропускная способность памяти в 70,4 Гбит/c.

Таблица итоговых характеристик видеокарт

  GeForce
9800 GTX
GeForce
GTX 260
GeForce
GTX 460
Графический процессор G92b GT200b GF104
Техпроцесс, нм 55 55 40
Число транзисторов, млн шт. 754 1400 1950
Универсальные процессоры, шт. 128 216 336
Текстурные блоки, шт. 64 72 56
ROP, шт. 16 28 32
Тактовая частота GPU, МГц 675 675 675
Тактовая частота шейдерного домена, МГц 1400 1400 1400
Скорость закраски, Гпикселей/c 10,8 18,9 21,6
Скорость выборки текстур, Гтекселей/c 43,2 43,2 37,8
Шина памяти, бит 256 448 256
Тип памяти GDDR3 GDDR3 GDDR5
Объём памяти, Мбайт 512 896 1024
Тактовая частота памяти, МГц 2200 1252 2200
Пропускная способность памяти 70,4 70,4 70,4

Тестовые приложения

Игры без активного PhysX:

  • Just Cause 2;
  • StarCraft 2;
  • Mafia 2 (PhysX off);
  • Call of Duty: Modern Warfare 2;
  • Lost Planet 2 Benchmark (DirectX 10);
  • Crysis Warhead (DirectX 10);
  • Batman: Arkham Asylum (PhysX off);
  • Metro 2033 (DirectX10);
  • S.T.A.L.K.E.R.: Call of Pripyat (DirectX 10).

Игры и бенчмарки с PhysX:

  • PhysX FluidMark;
  • Mafia 2 (PhysX on);
  • Batman: Arkham Asylum (PhysX on);
  • Dark Void.

Синтетико-игровое тестирование видеокарт проводилось на максимально возможных настройках (Ultra High) в двух разрешениях и с двумя настройками качества графики:

  • 1680x1050 AAx0, AFx0;
  • 1680x1050 AAx4, AFx16;
  • 1920x1080 AAx0, AFx0;
  • 1920x1080 AAx4, AFx16.

При этом использовался либо встроенный бенчмарк, либо программа Fraps для выявления среднего значения FPS.

Тестовая конфигурация

  • Материнская плата: M4A785TD-V EVO;
  • Процессор: Phenom II x4 810 (разблокированный до Phenom II x4 9x0) @3,5 ГГц;
  • Система охлаждения CPU: Ice Hammer IH-4401+;
  • Термоинтерфейс: АлСил-3;
  • Оперативная память: 2x2 Гбайт DDR3 1333 МГц Samsung;
  • Жесткий диск: WD Black Caviar 1 Тбайт;
  • Блок питания: Tuniq 950 Вт;
  • Монитор: Acer V243h.
  • ПО: Windows 7 Ultimate 32 bit, ForceWare 258.96, NVIDIA Systools

Результаты тестирования

Игры без активного PhysX:

Just Cause 2


1680x1050, AAx0, AFx0
Avg FPS

1680x1050, AAx4, AFx16
Avg FPS

1920x1080, AAx0, AFx0
Avg FPS

1920x1080, AAx4, AFx16
Avg FPS

Видно, что, несмотря на одинаковую пропускную способность памяти (разные тайминги в расчёт не берём) и идентичные тактовые частоты, GTX 460 хоть и опережает GTX 260, но не так сильно как этого бы хотелось. GF104 оказывается без малого в два раза быстрее чипа G92b и обходит GTX 260 в среднем на 10-20%.

StarCraft 2


1680x1050, AAx0, AFx0
Avg FPS

1680x1050, AAx4, AFx16
Avg FPS

1920x1080, AAx0, AFx0
Avg FPS

1920x1080, AAx4, AFx16
Avg FPS

Неужели игра так чувствительна к пропускной способности памяти? G92b и GT200 идут практически на равных в лёгких режимах, а GF104 хоть и показывает себя лучше, ненамного отстаёт от своих братьев.

Mafia 2


1680x1050, AAx0, AFx0
Avg FPS

1680x1050, AAx4, AFx16
Avg FPS

1920x1080, AAx0, AFx0
Avg FPS

1920x1080, AAx4, AFx16
Avg FPS

Чипы GT200b и GF104 вновь демонстрируют близкие результаты. Невзирая на практически 55% преимущество GF104 в потоковых процессорах, из-за меньшего числа текстурных блоков новенький GPU оказывается лишь на 10% быстрее. Если взглянуть на преимущество GT200b по сравнению с G92b, то можно заметить гораздо большую разницу, вопреки тому, что монструозный GT200b может похвастаться примерно тем же ~ 60% превосходством в исполнительных блоках.

Call of Duty: Modern Warfare 2


1680x1050, AAx0, AFx0
Avg FPS

1680x1050, AAx4, AFx16
Avg FPS

1920x1080, AAx0, AFx0
Avg FPS

1920x1080, AAx4, AFx16
Avg FPS

Ситуация повторилась – G92b проигрывает GT200b примерно 35-45%, в то время как GT200b отстает от GF104 всего-лишь на 10-15%, что весьма и весьма немного.

Lost Planet 2 Benchmark


1680x1050, AAx0, AFx0
Avg FPS

1680x1050, AAx4, AFx16
Avg FPS

1920x1080, AAx0, AFx0
Avg FPS

1920x1080, AAx4, AFx16
Avg FPS

В бенчмарке Lost Planet 2 отчётливо видно, как сильно падает производительность у GT200b и GF104 при переходе на более тяжёлые режимы графики. Скорее всего, это связано с сильно пострадавшей в результате урезания пропускной способности памятью.

Crysis: Warhead


1680x1050, AAx0, AFx0
Avg FPS

1680x1050, AAx4, AFx16
Avg FPS

1920x1080, AAx0, AFx0
Avg FPS

1920x1080, AAx4, AFx16
Avg FPS

А вот в Crysis Warhead чип GF104 демонстрирует великолепную выносливость, не так сильно заваливая планку в тяжёлых режимах, чего не скажешь о G92b или G200b. Если в Full HD с AAx4 и AFx16 GF104 потерял лишь около 25% своей скорости по сравнению с самым лёгким режимом, то G92b обвалился на 78%, а GT200b на 40%.

Batman: Arkham Asylum


1680x1050, AAx0, AFx0
Avg FPS

1680x1050, AAx4, AFx16
Avg FPS

1920x1080, AAx0, AFx0
Avg FPS

1920x1080, AAx4, AFx16
Avg FPS

Unreal Engine 3 довольно демократичный движок, поскольку ему вполне достаточно даже видеокарты уровня GeForce 9800 GTX. Сам G92b уступает GF104 всего 25-30%, несмотря на почти троекратный проигрыш по количеству потоковых процессоров.

Metro: 2033


1680x1050, AAx0, AFx0
Avg FPS

1680x1050, AAx4, AFx16
Avg FPS

1920x1080, AAx0, AFx0
Avg FPS

1920x1080, AAx4, AFx16
Avg FPS

В этом приложении расстановка сил повторяет большинство предыдущих – G92b примерно на 30-50% отстаёт от GT200b, в то время как GF104 опережает его на 25-30%.

S.T.A.L.K.E.R.: Call of Pripyat


1680x1050, AAx0, AFx0
Avg FPS

1680x1050, AAx4, AFx16
Avg FPS

1920x1080, AAx0, AFx0
Avg FPS

1920x1080, AAx4, AFx16
Avg FPS

В заключительном игровом тесте GF104 обходит G92b почти в два раза и обгоняет GT200b лишь на 20%. Учитывая, что по аппаратным характеристикам GF104 оказывается мощнее GT200b почти на треть, скромные 20% объясняются лишь меньшим количеством текстурных блоков, которые, увы, у GF104 являются самым узким местом.

Игры и бенчмарки с активным PhysX:

FluidMark


1680x1050, AAx0, AFx0
Avg FPS

1920x1080, AAx0, AFx0
Avg FPS

Mafia 2, PhysX ON


1680x1050, AAx0, AFx0
Avg FPS*

1680x1050, AAx4, AFx16
Avg FPS*

1920x1080, AAx0, AFx0
Avg FPS*

1920x1080, AAx4, AFx16
Avg FPS*
* Минимальное значение FPS - настройки PhysX High, максимальное значение FPS - настройки PhysX Medium

Batman: Arkham Asylum, PhysX ON


1680x1050, AAx0, AFx0
Avg FPS*

1920x1080, AAx0, AFx0
Avg FPS*
* Минимальное значение FPS - настройки PhysX High, максимальное значение FPS - настройки PhysX Medium

Dark Void


1680x1050, AAx0, AFx0
Avg FPS

1920x1080, AAx0, AFx0
Avg FPS

В целом, все видеопроцессоры демонстрируют аналогичные предыдущему тестированию результаты. Активация PhysX очень сильно снижает скорость видеокарт, сводя их производительность приблизительно на один уровень, который лишь немногим выше критической отметки в 30 FPS. При этом от количества потоковых процессоров (которые по идее должны великолепно распределяться между ускорением физики и обработкой графики) практически ничего не зависит – G92b отстаёт от GF104 совсем немного, и это при трехкратном проигрыше в количестве потоковых процессоров!

Заключение

Итак, завершающая часть тестирования подошла к концу. Сравнив три GPU – G92b, GT220b и GF104, можно сделать однозначный вывод – GF104 получился крайне удачным видеочипом. Возможно, даже слишком удачным – дабы видеокарты на его основе не составляли внутреннюю конкуренцию GeForce GTX 470, инженерам пришлось отключить один шейдерный процессор с 48 CUDA ядрами и 8 текстурными блоками, искусственно замедлив сам GPU.

Потому что слабо верится в то, что NVidia пошла на этот шаг только ради обеспечения должного количества годных GF104 – 40 нм техпроцесс давно налажен, да и GF104 не такой уж и сложный чип в производстве по сравнению с тем же GF100. Впрочем, главную цель, поставленную компанией NVidia по искусственному замедлению GPU, осуществить удалось лишь частично. Многие отечественные и зарубежные обзоры наглядно доказывают, что разогнанная до 800/4000 МГц GeForce GTX 460 идёт практически на равных с более дорогими GTX 470 и Radeon HD 5850.

Когда же Nvidia наконец разблокирует все мультипроцессоры в GF104? Скорее всего, тогда же, когда выпустит GTX 480 (GTX 485?) с 512 потоковыми процессорами или хорошую замену GTX 470.

Что касается сравнения GF104 с GT200b то здесь необходимо сказать следующее: несмотря на большое преимущество в потоковых процессорах, GF104 обходит своего предшественника не так хорошо как этого бы хотелось. Да, новичок семейства Fermi всегда лидирует, однако разрыв в скорости не такой большой в подавляющем числе приложений, всё-таки на абсолютно новую графическую архитектуру возлагались немалые надежды, да и пиар от лица NVidia был соответствующий. Возможно, в более свежих играх (а так же с выходом новых драйверов) разница в скорости между GF104 и GT200b будет неуклонно расти, но нам пока ничего не обещают.

G92b также очень интересен в сравнении с более новыми поколениями GPU – видно, что данный чип был хорошо продуман – 128 потоковых процессоров, 64 текстурных блока и 16 блоков ROP’s до сих пор творят чудеса. Даже на фоне GTX 460 ветеран G92b смотрится достойно – в среднем, скорость ниже лишь на 50-80%, притом, что потоковых процессоров у него втрое меньше, а растровых блоков и видеопамяти – вдвое. Да и цена раза в два-два с половиной ниже, чем у новичка, так что свою цену в 3000 рублей видеокарты на базе GTS 250 оправдывают на все 100%.

В остальном, никаких претензий к GF104 нет – он очень мощный, достаточно холодный, обладает сбалансированной аппаратной частью и имеет богатый нераскрытый потенциал, который пригодится в будущем (речь идёт об одном заблокированном шейдерном процессоре).

Вновь хотелось бы поздравить NVidia с выходом крайне удачной платы, которая рискует повторить успех GeForce 8800 GT и стать самой народной видеокартой начального уровня топкласса (или если хотите, продвинутого бойца среднего класса) по очень небольшой цене.

Выражаем благодарность:

Благодарю за помощь в подготовке материала к публикации: donnerjack.

Морозов Роман aka Zik