Бенчмаркинг в 3Dmark01 SE. Часть первая. Разгон

Этот бенчмарк является доработанной версией пакета 3DMark01 и был выпущен в феврале 2002 года. Основные тесты были перенесены из первой версии пакета, но был добавлен новый feature test и расширен перечень поддерживаемого железа. Вообще же, бенчмарк стал первым, поддерживающим DirectX 8 (благодаря использованию его ключевых особенностей – вершинных/пиксельных шейдеров и point sprites). В основе бенчмарка – несинтетический движок MAX-FX, на котором «бегают» такие игры, как Max Payne 1&2.
Структурно, сам бенчмарк состоит из 4 игровых сцен, три из которых прогоняются с низким и высоким уровнем детализации – итого, 7 игровых сцен:
1.Game 1: Car Chase – Low Detail
2.Game 1: Car Chase – High Detail
3.Game 2: Dragothic – Low detail
4.Game 2: Dragothic – High detail
5.Game 3: Lobby – Low detail
6.Game 3: Lobby – High Detail
7.Game 4: Nature
В следствие преклонного возраста теста, он чудовищно процессорозависим. Особенно ярко это проявляется в первых шести игровых тестах – они сделаны на DirectX 7. В частности, достаточно сказать, что моя старая 7900GS на 3.8 ГГц E6400 показывает такие же результаты, как HD4870 на 2,66 ГГц E8200 – порядка 50000 на системе без твиков. Если взглянуть на достижения лучших в этом тестовом пакете на ресурсе HWBOT.ORG, то станет ясно что мощность графической карты во многом отступает на второй план:
1.123944 marks – текущий мировой рекорд на одночиповой карте (GTX280), поставленный участником российской команды TopMods.net Pofigist’ом.
2.131072 marks – текущий мировой рекорд на многочиповой системе (2хGTX280), поставленный легендарным KingPin’ом, участником команды XtremeSystems.
Т.е. мы наблюдаем разрыв, не превышающий 6%, при несоизмеримой разнице в производительности графической подсистемы ПК. Как было сказано кем-то с форума XtremeSystems: "Настоящие мужчины соревнуются в скорости процессора в 3DMark01, а не в SuperPi", что и стало своеобразным эпиграфом к статье.
Таким образом, мы плавно переходим к сути статьи – а именно, к изучению зависимости итогового балла от разгона комплектующих. Твикам драйвера ForceWare и непосредственно методике прогона теста будет посвящена еще одна статья.
Итак, тестовый стенд:
Конфигурация:
1. Core 2 Duo E6400 (2MB L2, 266FSB)
2. Abit IP35-E
3. ApogeeGT DDRII-1066 (1066MHz 5-5-5-15 @2.1v)
4. Colorful GeForce 9500GT (core=550, shader=1375, memory=800).
5. Прочее, не оказывающее существенного влияния на производительность
Программное обеспечение:
1. Windows XP SP2, x64 Professional - as is, без оптимизаций.
2. ForceWare 182.06
3. Intel 8.5.0.1008
4. DirectX 9.0c с обновлениями от 08.2008.
5. 3DMark01 SE build 330.
6. CPU-Z 1.49/1.50
7. MemSet 4.0
8. Everest 5.0
9. SetFSB 2.1.87.00
Решено было провести сравнение на одинаковой частоте процессора в 1600 МГц с разными множителями и соответствующим коэффициентом на памяти, помогающим удержать значение ее частоты в заданном коридоре производительности, что подтверждается результатами в Everest 5.0, с целью выявления влияния частоты внешней шины на результат:

Как мы видим, наиболее эффективным здесь режимом, по результатам Everest, является работа при соотношении частоты внешней шины и шины памяти как 1:1. Теперь посмотрим на полученные в бенчмарке результаты:

Как видно, прирост при переходе на более быструю шину есть. Но, учитывая, что скорость подсистемы памяти удержать в одних значениях нам не удалось, и при переходе на режим с более быстрой шиной возрастала и производительность памяти – говорить о влиянии частоты внешней шины процессора на результат нам не приходится.
Помимо этого, были использованы еще три варианта с разгоном множителем:

Опять таки, с ростом частоты процессора улучшаются и показатели работы памяти – при неизменных ее задержках. Но это – давно известный факт. Посмотрим, как масштабируются результаты:

Эффект есть, причем объяснить его влиянием одной только памяти невозможно. Впрочем, рост частоты с 1,2ГГц до 1,4ГГц (+16,6%) приводит к росту результата в бенчмарке на 13%. Дальнейшее увеличение частоты до 1,6ГГц (+14,3% к 1,4ГГц) приводит к повышению результата на 8,5% - т.е. эффект влияния частоты процессора нелинеен и, на частотах в районе 3,5 ГГц должен стать несущественным. Причина здесь одна – малая мощность графической карты, которой будет хватать даже такого слабого процессора. Отодвинуть планку, на которой видеочип еще процессорозависим, нам поможет разгон видеокарты. Заметим только, что Game 4 зависит только от скорости видеокарты даже на частоте процессора 1,2ГГц.
В данном варианте будут испробованы следующие комбинации:

В итоге, мы получаем следующий расклад по тесту:

Как видно, тайминги оказывают несущественное влияние на производительность платформы. Это отражается как в тестах Everest (за исключением существенного снижения латентности доступа к памяти), так и в самом 3DMark01. А вот повышение частоты памяти воспринимается бенчмарком довольно неплохо, что и находит отражение в итоговом балле. Вывод один – тест очень хорошо отнесется к системам на базе высокочастотной DDR3 памяти, причем возросшие задержки этого типа памяти будут тестом проигнорированы. Опять же, Game test 4 крайне незаметно реагирует на ускорение работы связки CPU-RAM. Что же, пришло время проверить и это предположение. Переходим к изучению влияния видеокарты на итоговый балл.
Для выяснения зависимости результатов от скорости работы блоков графической карты частота процессора была выставлена как 450*8, что дало 3,6 ГГц стабильной частоты – для минимизации процессорной зависимости карты. Память работала в режиме DDRII-1125 с таймингами 4-5-5-13 при соотношении DRAM:FSB 4:5.
Для выявления зависимости результата от частоты шейдерного домена были проведены прогоны при его частоте, равной 1200, 1400, 1600 MHz при неизменных частотах блока растеризации и памяти. Итоги прогонов сведены в таблицу:

Очевидно, что подтесты по разному реагируют на повышение частоты шейдерного домена на 16,6% (1200->1400):
Game 1 LD (+6.3%)
Game 1 HD (+2.3%)
Game 2 LD (+3.3%)
Game 2 HD (+4%)
Game 3 LD (+0.75%)
Game 3 HD (+0.26%)
Game 4 (+2%)
Т.о. крайне сомнительна необходимость уделять пристальное внимание разгону шейдерного домена, в большинстве случаев. Наиболее отзывчивым оказался Game test 1 LD, но и его реакция далека от идеальной.
При том же сетапе, что использовался для выявления влияния шейдерного домена, т.е. частоте процессора в 3,6 ГГц, я изменял частоту блока растеризации, причем она принимала вид 400, 500, 600 MHz. Частоты памяти и шейдерного домена оставались на дефолте. Результаты в неизменной таблице:

На первый взгляд, цифры прироста стали более значительными. Пересчитав все в процентах, получаем, что прирост частоты ROP на 25% вылился в подъем FPS:
Game 1 LD (+1%)
Game 1 HD (+1.5%)
Game 2 LD (+6.8%)
Game 2 HD (+10%)
Game 3 LD (+4.3%)
Game 3 HD (+1%)
Game 4 (+11.3%)
Выходит, что и в этом случае нет прямой зависимости результата от частоты конкретного блока. Весьма неплохо повышение частоты ROP восприняли тесты Game 2 LD, Game 2 HD, Game 4.
Те же самые 3,6 ГГц CPU, 1125 GHz DDRII. Теперь настал черед посмотреть на последствия работы при частоте памяти графического процессора при частотах 500, 700, 900 MHz:

Цифры прироста щекочут нервы - +7000 только за счет разгона памяти. Ну а что же у нас в процентном соотношении? Посмотрим на 28,6% прирост частоты памяти с 700 до 900 MHz:
Game 1 LD (+9%)
Game 1 HD (+1%)
Game 2 LD (+9.7%)
Game 2 HD (+6.9%)
Game 3 LD (+3.4%)
Game 3 HD (-0.2%)
Game 4 (+14.7%)
Что же, очень неплохо. Эффект от разгона памяти несоизмеримо выше такового от разгона графического чипа. Холодно восприняли прибавку в частоте графической памяти тесты Game 1 HD, Game 3 LD, Game 3 HD. ИМХО, на этом графическом чипе внимание в первую очередь стоит уделить памяти.
Напоследок, я решил вернуться к неудачам, с которыми мне пришлось столкнуться в ходе написания статьи. Первая неудача заключалась в том, что первоначально я планировал исследовать зависимость от частот видеокарты при частоте процессора, равной 4ГГц. К сожалению, эта частота доступна только при обдуве системы морозным воздухом (уж простите, но для алмаатинцев морозным воздухом становится «едва ниже нуля»). И проведя половину требуемых тестов на морозе, вторую половину тестов я сделать не смог – пришла весна, а с нею – отсутствие морозов.
Тем не менее, одно я заметил – странное несоответствие результатов Game 4 при частоте процессора в 4 ГГц и 3,6 ГГц – это при том, что согласно всем предыдущим выводам, частота процессора не могла повлиять на результат в этом тесте. С песней и плясками, я начал выяснять причину. Как ни странно, единственное различие, помимо частот памяти, таймингов и процессора, которое существовало – частота PCI-E. Свои попытки на 4 ГГц частоты процессора я проводил при частоте PCI-E равной 110 MHz, в то время как все результаты, полученные на частоте 3,6 GHz, были получены при частоте равной 100 MHz. Решив проверить свое, казалось бы безумное, предположение, я получил следующие результаты для частот CPU=3.6 GHz, DRAM=1125MHz (4-5-5-13) и дефолтных частотах видеокарты:

Эффект заставляет задуматься? 20% наращивание частоты PCI-E привело к следующему росту в подтестах:
Game 1 LD (+7,5%)
Game 1 HD (+4,7%)
Game 2 LD (+9.2%)
Game 2 HD (+9,8%)
Game 3 LD (+3.6%)
Game 3 HD (-0.1%)
Game 4 (+6,7%)
Вспомнив о привязке частоты чипа не то 9600GT, не то еще какого-либо, к частоте PCI-E, я заподозрил, что и в данном случае применимо это объяснение. Или мне это только кажется?
На этом заканчивается первая часть статьи. Выводы очевидны:
1.Процессорозависимость бенчмарка даже на очень слабых видеокартах.
2.Минимальное влияние таймингов, частоты FSB и частот шейдерного домена на итоговой результат.
3.Заметное влияние частот памяти, ROP и графической памяти на итоговый балл.
4.Наиболее зависит от производительности видеокарты Game 4
5.Наиболее зависит от производительности процессора Game 3 в обоих инкарнациях.
Архив со всеми скриншотами можно взять здесь
Обсудить можно здесь
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Сейчас обсуждают