Бенчмаркинг в 3Dmark01 SE. Часть первая. Разгон

28 февраля 2009, суббота 17:17
для раздела Блоги
REAL men bench 3DMark01


Введение

Этот бенчмарк является доработанной версией пакета 3DMark01 и был выпущен в феврале 2002 года. Основные тесты были перенесены из первой версии пакета, но был добавлен новый feature test и расширен перечень поддерживаемого железа. Вообще же, бенчмарк стал первым, поддерживающим DirectX 8 (благодаря использованию его ключевых особенностей – вершинных/пиксельных шейдеров и point sprites). В основе бенчмарка – несинтетический движок MAX-FX, на котором «бегают» такие игры, как Max Payne 1&2.
Структурно, сам бенчмарк состоит из 4 игровых сцен, три из которых прогоняются с низким и высоким уровнем детализации – итого, 7 игровых сцен:
1.Game 1: Car Chase – Low Detail
2.Game 1: Car Chase – High Detail
3.Game 2: Dragothic – Low detail
4.Game 2: Dragothic – High detail
5.Game 3: Lobby – Low detail
6.Game 3: Lobby – High Detail
7.Game 4: Nature

В следствие преклонного возраста теста, он чудовищно процессорозависим. Особенно ярко это проявляется в первых шести игровых тестах – они сделаны на DirectX 7. В частности, достаточно сказать, что моя старая 7900GS на 3.8 ГГц E6400 показывает такие же результаты, как HD4870 на 2,66 ГГц E8200 – порядка 50000 на системе без твиков. Если взглянуть на достижения лучших в этом тестовом пакете на ресурсе HWBOT.ORG, то станет ясно что мощность графической карты во многом отступает на второй план:
1.123944 marks – текущий мировой рекорд на одночиповой карте (GTX280), поставленный участником российской команды TopMods.net Pofigist’ом.
2.131072 marks – текущий мировой рекорд на многочиповой системе (2хGTX280), поставленный легендарным KingPin’ом, участником команды XtremeSystems.
Т.е. мы наблюдаем разрыв, не превышающий 6%, при несоизмеримой разнице в производительности графической подсистемы ПК. Как было сказано кем-то с форума XtremeSystems: "Настоящие мужчины соревнуются в скорости процессора в 3DMark01, а не в SuperPi", что и стало своеобразным эпиграфом к статье.
Таким образом, мы плавно переходим к сути статьи – а именно, к изучению зависимости итогового балла от разгона комплектующих. Твикам драйвера ForceWare и непосредственно методике прогона теста будет посвящена еще одна статья.

Итак, тестовый стенд:
Конфигурация:
1. Core 2 Duo E6400 (2MB L2, 266FSB)
2. Abit IP35-E
3. ApogeeGT DDRII-1066 (1066MHz 5-5-5-15 @2.1v)
4. Colorful GeForce 9500GT (core=550, shader=1375, memory=800).
5. Прочее, не оказывающее существенного влияния на производительность
Программное обеспечение:
1. Windows XP SP2, x64 Professional - as is, без оптимизаций.
2. ForceWare 182.06
3. Intel 8.5.0.1008
4. DirectX 9.0c с обновлениями от 08.2008.
5. 3DMark01 SE build 330.
6. CPU-Z 1.49/1.50
7. MemSet 4.0
8. Everest 5.0
9. SetFSB 2.1.87.00

Влияние скорости CPU
Решено было провести сравнение на одинаковой частоте процессора в 1600 МГц с разными множителями и соответствующим коэффициентом на памяти, помогающим удержать значение ее частоты в заданном коридоре производительности, что подтверждается результатами в Everest 5.0, с целью выявления влияния частоты внешней шины на результат:

Как мы видим, наиболее эффективным здесь режимом, по результатам Everest, является работа при соотношении частоты внешней шины и шины памяти как 1:1. Теперь посмотрим на полученные в бенчмарке результаты:

Как видно, прирост при переходе на более быструю шину есть. Но, учитывая, что скорость подсистемы памяти удержать в одних значениях нам не удалось, и при переходе на режим с более быстрой шиной возрастала и производительность памяти – говорить о влиянии частоты внешней шины процессора на результат нам не приходится.
Помимо этого, были использованы еще три варианта с разгоном множителем:

Опять таки, с ростом частоты процессора улучшаются и показатели работы памяти – при неизменных ее задержках. Но это – давно известный факт. Посмотрим, как масштабируются результаты:

Эффект есть, причем объяснить его влиянием одной только памяти невозможно. Впрочем, рост частоты с 1,2ГГц до 1,4ГГц (+16,6%) приводит к росту результата в бенчмарке на 13%. Дальнейшее увеличение частоты до 1,6ГГц (+14,3% к 1,4ГГц) приводит к повышению результата на 8,5% - т.е. эффект влияния частоты процессора нелинеен и, на частотах в районе 3,5 ГГц должен стать несущественным. Причина здесь одна – малая мощность графической карты, которой будет хватать даже такого слабого процессора. Отодвинуть планку, на которой видеочип еще процессорозависим, нам поможет разгон видеокарты. Заметим только, что Game 4 зависит только от скорости видеокарты даже на частоте процессора 1,2ГГц.

Влияние скорости памяти
В данном варианте будут испробованы следующие комбинации:

В итоге, мы получаем следующий расклад по тесту:

Как видно, тайминги оказывают несущественное влияние на производительность платформы. Это отражается как в тестах Everest (за исключением существенного снижения латентности доступа к памяти), так и в самом 3DMark01. А вот повышение частоты памяти воспринимается бенчмарком довольно неплохо, что и находит отражение в итоговом балле. Вывод один – тест очень хорошо отнесется к системам на базе высокочастотной DDR3 памяти, причем возросшие задержки этого типа памяти будут тестом проигнорированы. Опять же, Game test 4 крайне незаметно реагирует на ускорение работы связки CPU-RAM. Что же, пришло время проверить и это предположение. Переходим к изучению влияния видеокарты на итоговый балл.

Влияние скорости шейдерного домена
Для выяснения зависимости результатов от скорости работы блоков графической карты частота процессора была выставлена как 450*8, что дало 3,6 ГГц стабильной частоты – для минимизации процессорной зависимости карты. Память работала в режиме DDRII-1125 с таймингами 4-5-5-13 при соотношении DRAM:FSB 4:5.
Для выявления зависимости результата от частоты шейдерного домена были проведены прогоны при его частоте, равной 1200, 1400, 1600 MHz при неизменных частотах блока растеризации и памяти. Итоги прогонов сведены в таблицу:

Очевидно, что подтесты по разному реагируют на повышение частоты шейдерного домена на 16,6% (1200->1400):
Game 1 LD (+6.3%)
Game 1 HD (+2.3%)
Game 2 LD (+3.3%)
Game 2 HD (+4%)
Game 3 LD (+0.75%)
Game 3 HD (+0.26%)
Game 4 (+2%)
Т.о. крайне сомнительна необходимость уделять пристальное внимание разгону шейдерного домена, в большинстве случаев. Наиболее отзывчивым оказался Game test 1 LD, но и его реакция далека от идеальной.

Влияние скорости блока растеризации
При том же сетапе, что использовался для выявления влияния шейдерного домена, т.е. частоте процессора в 3,6 ГГц, я изменял частоту блока растеризации, причем она принимала вид 400, 500, 600 MHz. Частоты памяти и шейдерного домена оставались на дефолте. Результаты в неизменной таблице:

На первый взгляд, цифры прироста стали более значительными. Пересчитав все в процентах, получаем, что прирост частоты ROP на 25% вылился в подъем FPS:
Game 1 LD (+1%)
Game 1 HD (+1.5%)
Game 2 LD (+6.8%)
Game 2 HD (+10%)
Game 3 LD (+4.3%)
Game 3 HD (+1%)
Game 4 (+11.3%)
Выходит, что и в этом случае нет прямой зависимости результата от частоты конкретного блока. Весьма неплохо повышение частоты ROP восприняли тесты Game 2 LD, Game 2 HD, Game 4.

Влияние скорости графической памяти
Те же самые 3,6 ГГц CPU, 1125 GHz DDRII. Теперь настал черед посмотреть на последствия работы при частоте памяти графического процессора при частотах 500, 700, 900 MHz:

Цифры прироста щекочут нервы - +7000 только за счет разгона памяти. Ну а что же у нас в процентном соотношении? Посмотрим на 28,6% прирост частоты памяти с 700 до 900 MHz:
Game 1 LD (+9%)
Game 1 HD (+1%)
Game 2 LD (+9.7%)
Game 2 HD (+6.9%)
Game 3 LD (+3.4%)
Game 3 HD (-0.2%)
Game 4 (+14.7%)
Что же, очень неплохо. Эффект от разгона памяти несоизмеримо выше такового от разгона графического чипа. Холодно восприняли прибавку в частоте графической памяти тесты Game 1 HD, Game 3 LD, Game 3 HD. ИМХО, на этом графическом чипе внимание в первую очередь стоит уделить памяти.

Влияние частоты PCI-E rev.1.0
Напоследок, я решил вернуться к неудачам, с которыми мне пришлось столкнуться в ходе написания статьи. Первая неудача заключалась в том, что первоначально я планировал исследовать зависимость от частот видеокарты при частоте процессора, равной 4ГГц. К сожалению, эта частота доступна только при обдуве системы морозным воздухом (уж простите, но для алмаатинцев морозным воздухом становится «едва ниже нуля»). И проведя половину требуемых тестов на морозе, вторую половину тестов я сделать не смог – пришла весна, а с нею – отсутствие морозов.
Тем не менее, одно я заметил – странное несоответствие результатов Game 4 при частоте процессора в 4 ГГц и 3,6 ГГц – это при том, что согласно всем предыдущим выводам, частота процессора не могла повлиять на результат в этом тесте. С песней и плясками, я начал выяснять причину. Как ни странно, единственное различие, помимо частот памяти, таймингов и процессора, которое существовало – частота PCI-E. Свои попытки на 4 ГГц частоты процессора я проводил при частоте PCI-E равной 110 MHz, в то время как все результаты, полученные на частоте 3,6 GHz, были получены при частоте равной 100 MHz. Решив проверить свое, казалось бы безумное, предположение, я получил следующие результаты для частот CPU=3.6 GHz, DRAM=1125MHz (4-5-5-13) и дефолтных частотах видеокарты:

Эффект заставляет задуматься? 20% наращивание частоты PCI-E привело к следующему росту в подтестах:
Game 1 LD (+7,5%)
Game 1 HD (+4,7%)
Game 2 LD (+9.2%)
Game 2 HD (+9,8%)
Game 3 LD (+3.6%)
Game 3 HD (-0.1%)
Game 4 (+6,7%)
Вспомнив о привязке частоты чипа не то 9600GT, не то еще какого-либо, к частоте PCI-E, я заподозрил, что и в данном случае применимо это объяснение. Или мне это только кажется?

Вместо заключения.
На этом заканчивается первая часть статьи. Выводы очевидны:
1.Процессорозависимость бенчмарка даже на очень слабых видеокартах.
2.Минимальное влияние таймингов, частоты FSB и частот шейдерного домена на итоговой результат.
3.Заметное влияние частот памяти, ROP и графической памяти на итоговый балл.
4.Наиболее зависит от производительности видеокарты Game 4
5.Наиболее зависит от производительности процессора Game 3 в обоих инкарнациях.

Архив со всеми скриншотами можно взять здесь
Обсудить можно здесь
Оценитe материал

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают