Продолжение. Начало - тут.
Как показали результаты первой части, GeForce GTX 460 является очень мощной видеокартой в своем ценовом классе, однако некогда сильнейшие представители топсегмента – GeForce 9800GX2 и GeForce GTX 260 216 sp также выступили исключительно с положительной стороны, причём иногда наступая новичку на пятки.
Поскольку все участники прошедшего тестирования работали на разных тактовых частотах, было решено прогнать их в тех же приложениях, но при этом напрямую сравнив именно GPU данных видеокарт, установив одинаковые тактовые частоты для ядра и шейдерного домена, и вдобавок одинаковую пропускную способность для видеопамяти. Таким образом, участники тестирования обладали идентичными частотными характеристиками и могли бы продемонстрировать “чистые результаты”.
В качестве трёх основных видеокарт, представляющих разное поколение графических процессоров, выступят GeForce 9800 GTX 512 Мбайт, GeForce GTX 260 216 sp 896 Мбайт и GeForce GTX 460 1 Гбайт.
Видеочип G92b является настоящим долгожителем – видеокарты с ним выпускаются до сих пор, хотя уже в октябре ему стукнет три года. GPU с таким долгим сроком службы надо еще поискать – не многие дожили до такого почётного возраста, не будучи снятыми с производства.
Начав свою карьеру с урезанного варианта для GeForce 8800 GT, он вскоре прописался в GeForce 8800 GTS 512 Мбайт и GeForce 8800 GS, которые потом успешно были переименованы соответственно в GeForce 9800 GTX и GeForce 9600 GSO.
Сегодняшний игрок начального уровня среднего класса – GeForce GTS 250 хоть и лишен поддержки DirectX 11, но всё ещё успешно конкурирует с Radeon HD 5670, а в некоторых случаях даже с Radeon HD 5750. Следует учитывать что в ближайшие месяцы чип будет снят с производства (если eще не снят), ведь буквально на днях Nvidia анонсировала его долгожданную замену – GeForce GTS 450.
Процессор G92b содержит 8 мультипроцессоров, по 16 потоковых процессора в каждом.
Характеристики G92b (GeForce 9800 GTX)
На момент анонса в середине 2008 года этот GPU был самым мощным монолитным видеочипом, по числу исполнительных блоков практически вдвое опережавшим аналогичные характеристики G92b. Он был урезан по количеству потоковых, текстурных и растровых блоков, дав жизнь сначала GeForce GTX 260 192 sp, а потом и GTX 260 216 sp, GTX 275 и GTX 295. Однако из-за высокой стоимости производства такого большого чипа начальная цена на видеокарты семейства GTX оставляла желать лучшего. Уже через месяц после анонса NVidia немного подкрутила ценник, сделав его более адекватным для конкуренции линейке Radeon HD 4800, но из-за первоначально завышенной цены продажи новых видеокарт первое время были не такими большими, как хотелось бы производителю.
Процессор G200b содержит 10 мультипроцессоров по 24 потоковых процессора в каждом. У GeForce GTX 260 216 активны лишь 9 из них, а у GTX 260 192 – 8.
Характеристики G200b (GeForce GTX 260 216)
Выпущен как недорогая и достаточно мощная замена предыдущему поколению видеокарт семейства GeForce GTX 260. У данной видеокарты работают не все мультипроцессоры, один из них отключён. Как скоро появится версия с полноценными 384 потоковыми процессорами пока неясно.
Всего чип GF104 содержит 8 мультипроцессоров по 48 потоковых процессоров в каждом. Примечательно, что версия GTX 460 768 Мбайт обладает только 24 блоками ROP’s. А вот её гигабайтная сестра получила все 32 блока ROP’s - в ее чипе отключены только шейдерные процессоры и текстурные блоки, растровые блоки остались работоспособными.
Характеристики GF104 (GeForce GTX 460 1 Гбайт)
Прежде чем приступить к тестированию, мы взглянем на заводские характеристики GPU:
| G92b (9800 GTX) | G200b (GTX 260) | GF104 (GTX 460) | |
| Частота GPU, МГц | 675 | 575 | 675 |
| Частота шейдерного домена, МГц | 1688 | 1240 | 1350 |
Видно, что у G92b самые высокие частоты, а у G200b – самые низкие. Дабы уровнять участников, для всех GPU были установлены одинаковые показатели тактовых частот – 675/1400 МГц.
| GeForce 9800 GTX |
GeForce GTX 260 |
GeForce GTX 460 |
|
| Частота видеопамяти, МГц | 2200 | 2000 | 3600 |
| Разрядность шины памяти, бит | 256 | 448 | 256 |
| Итоговая пропускная способность, Гбит/c* | 70,4 | 112 | 115 |
*Пропускная способность памяти считается по формуле: (частота видеопамяти * разрядность шины памяти / 8000).
Таким образом, для достижения одинаковой пропускной способности необходимо сделать даунклок тактовых частот памяти двух видеокарт до значений GeForce 9800 GTX:
| GeForce 9800 GTX |
GeForce GTX 260 |
GeForce GTX 460 |
|
| Частота видеопамяти, МГц | 2200 | 1252 | 2200 |
| Разрядность шины памяти, бит | 256 | 448 | 256 |
Для всех тестируемых плат была установлена пропускная способность памяти в 70,4 Гбит/c.
| GeForce 9800 GTX |
GeForce GTX 260 |
GeForce GTX 460 |
|
| Графический процессор | G92b | GT200b | GF104 |
| Техпроцесс, нм | 55 | 55 | 40 |
| Число транзисторов, млн шт. | 754 | 1400 | 1950 |
| Универсальные процессоры, шт. | 128 | 216 | 336 |
| Текстурные блоки, шт. | 64 | 72 | 56 |
| ROP, шт. | 16 | 28 | 32 |
| Тактовая частота GPU, МГц | 675 | 675 | 675 |
| Тактовая частота шейдерного домена, МГц | 1400 | 1400 | 1400 |
| Скорость закраски, Гпикселей/c | 10,8 | 18,9 | 21,6 |
| Скорость выборки текстур, Гтекселей/c | 43,2 | 43,2 | 37,8 |
| Шина памяти, бит | 256 | 448 | 256 |
| Тип памяти | GDDR3 | GDDR3 | GDDR5 |
| Объём памяти, Мбайт | 512 | 896 | 1024 |
| Тактовая частота памяти, МГц | 2200 | 1252 | 2200 |
| Пропускная способность памяти | 70,4 | 70,4 | 70,4 |
Игры без активного PhysX:
Игры и бенчмарки с PhysX:
Синтетико-игровое тестирование видеокарт проводилось на максимально возможных настройках (Ultra High) в двух разрешениях и с двумя настройками качества графики:
При этом использовался либо встроенный бенчмарк, либо программа Fraps для выявления среднего значения FPS.
Игры без активного PhysX:
Видно, что, несмотря на одинаковую пропускную способность памяти (разные тайминги в расчёт не берём) и идентичные тактовые частоты, GTX 460 хоть и опережает GTX 260, но не так сильно как этого бы хотелось. GF104 оказывается без малого в два раза быстрее чипа G92b и обходит GTX 260 в среднем на 10-20%.
Неужели игра так чувствительна к пропускной способности памяти? G92b и GT200 идут практически на равных в лёгких режимах, а GF104 хоть и показывает себя лучше, ненамного отстаёт от своих братьев.
Чипы GT200b и GF104 вновь демонстрируют близкие результаты. Невзирая на практически 55% преимущество GF104 в потоковых процессорах, из-за меньшего числа текстурных блоков новенький GPU оказывается лишь на 10% быстрее. Если взглянуть на преимущество GT200b по сравнению с G92b, то можно заметить гораздо большую разницу, вопреки тому, что монструозный GT200b может похвастаться примерно тем же ~ 60% превосходством в исполнительных блоках.
Ситуация повторилась – G92b проигрывает GT200b примерно 35-45%, в то время как GT200b отстает от GF104 всего-лишь на 10-15%, что весьма и весьма немного.
В бенчмарке Lost Planet 2 отчётливо видно, как сильно падает производительность у GT200b и GF104 при переходе на более тяжёлые режимы графики. Скорее всего, это связано с сильно пострадавшей в результате урезания пропускной способности памятью.
А вот в Crysis Warhead чип GF104 демонстрирует великолепную выносливость, не так сильно заваливая планку в тяжёлых режимах, чего не скажешь о G92b или G200b. Если в Full HD с AAx4 и AFx16 GF104 потерял лишь около 25% своей скорости по сравнению с самым лёгким режимом, то G92b обвалился на 78%, а GT200b на 40%.
Unreal Engine 3 довольно демократичный движок, поскольку ему вполне достаточно даже видеокарты уровня GeForce 9800 GTX. Сам G92b уступает GF104 всего 25-30%, несмотря на почти троекратный проигрыш по количеству потоковых процессоров.
В этом приложении расстановка сил повторяет большинство предыдущих – G92b примерно на 30-50% отстаёт от GT200b, в то время как GF104 опережает его на 25-30%.
В заключительном игровом тесте GF104 обходит G92b почти в два раза и обгоняет GT200b лишь на 20%. Учитывая, что по аппаратным характеристикам GF104 оказывается мощнее GT200b почти на треть, скромные 20% объясняются лишь меньшим количеством текстурных блоков, которые, увы, у GF104 являются самым узким местом.
Игры и бенчмарки с активным PhysX:
В целом, все видеопроцессоры демонстрируют аналогичные предыдущему тестированию результаты. Активация PhysX очень сильно снижает скорость видеокарт, сводя их производительность приблизительно на один уровень, который лишь немногим выше критической отметки в 30 FPS. При этом от количества потоковых процессоров (которые по идее должны великолепно распределяться между ускорением физики и обработкой графики) практически ничего не зависит – G92b отстаёт от GF104 совсем немного, и это при трехкратном проигрыше в количестве потоковых процессоров!
Итак, завершающая часть тестирования подошла к концу. Сравнив три GPU – G92b, GT220b и GF104, можно сделать однозначный вывод – GF104 получился крайне удачным видеочипом. Возможно, даже слишком удачным – дабы видеокарты на его основе не составляли внутреннюю конкуренцию GeForce GTX 470, инженерам пришлось отключить один шейдерный процессор с 48 CUDA ядрами и 8 текстурными блоками, искусственно замедлив сам GPU.
Потому что слабо верится в то, что NVidia пошла на этот шаг только ради обеспечения должного количества годных GF104 – 40 нм техпроцесс давно налажен, да и GF104 не такой уж и сложный чип в производстве по сравнению с тем же GF100. Впрочем, главную цель, поставленную компанией NVidia по искусственному замедлению GPU, осуществить удалось лишь частично. Многие отечественные и зарубежные обзоры наглядно доказывают, что разогнанная до 800/4000 МГц GeForce GTX 460 идёт практически на равных с более дорогими GTX 470 и Radeon HD 5850.
Когда же Nvidia наконец разблокирует все мультипроцессоры в GF104? Скорее всего, тогда же, когда выпустит GTX 480 (GTX 485?) с 512 потоковыми процессорами или хорошую замену GTX 470.
Что касается сравнения GF104 с GT200b то здесь необходимо сказать следующее: несмотря на большое преимущество в потоковых процессорах, GF104 обходит своего предшественника не так хорошо как этого бы хотелось. Да, новичок семейства Fermi всегда лидирует, однако разрыв в скорости не такой большой в подавляющем числе приложений, всё-таки на абсолютно новую графическую архитектуру возлагались немалые надежды, да и пиар от лица NVidia был соответствующий. Возможно, в более свежих играх (а так же с выходом новых драйверов) разница в скорости между GF104 и GT200b будет неуклонно расти, но нам пока ничего не обещают.
G92b также очень интересен в сравнении с более новыми поколениями GPU – видно, что данный чип был хорошо продуман – 128 потоковых процессоров, 64 текстурных блока и 16 блоков ROP’s до сих пор творят чудеса. Даже на фоне GTX 460 ветеран G92b смотрится достойно – в среднем, скорость ниже лишь на 50-80%, притом, что потоковых процессоров у него втрое меньше, а растровых блоков и видеопамяти – вдвое. Да и цена раза в два-два с половиной ниже, чем у новичка, так что свою цену в 3000 рублей видеокарты на базе GTS 250 оправдывают на все 100%.
В остальном, никаких претензий к GF104 нет – он очень мощный, достаточно холодный, обладает сбалансированной аппаратной частью и имеет богатый нераскрытый потенциал, который пригодится в будущем (речь идёт об одном заблокированном шейдерном процессоре).
Вновь хотелось бы поздравить NVidia с выходом крайне удачной платы, которая рискует повторить успех GeForce 8800 GT и стать самой народной видеокартой начального уровня топкласса (или если хотите, продвинутого бойца среднего класса) по очень небольшой цене.
Выражаем благодарность: