Sамая Lучшая Iнтеграция: сравнение прироста скорости от режима SLI на платформах AMD и Intel

Введение

Выпустив очень удачный чипсет для процессоров AMD – nForce4 SLI, и завоевав уже около 50% рынка наборов логики под данную платформу, компания NVIDIA решила не останавливаться на достигнутом и в начале апреля анонсировала чипсет nForce4 SLI (Intel Edition), предназначенный для процессоров Intel. В отличие от своего предшественника nForce4 SLI (Intel Edition) построен по классической двухчиповой схеме. Так как, режим SLI в nForce4 SLI (Intel Edition) реализуется так же, как и в AMD Athlon 64 системах – путём использования двух шин PCI Express x8, то почему бы не сравнить эффективность их работы с разными процессорами и типами оперативной памяти (DDR и DDR2)? Где прирост производительности от активации SLI будет выше? На платформе с процессором AMD Athlon 64, имеющим встроенный контроллер памяти и использующим только DDR память, или в системах на базе процессоров Intel Pentium 4 с поддержкой оперативной памяти DDR2 вплоть до DDR2-667 SDRAM? Вот это мы с Вами сегодня и попробуем выяснить.

Тестовая конфигурация, драйверы и методика тестирования

Все тесты были проведены на следующих платформах:

Комплектующие Платформа на базе AMD Athlon 64 Платформа на базе Intel Pentium 4
Материнская плата: MSI K8N Diamond (NVIDIA nForce4 SLI), Socket 939, BIOS v.1.1 MSI P4N Diamond (NVIDIA nForce4 SLI IE), LGA775, BIOS v.1.0
Процессор: AMD Athlon 64 3200+, 2000MHz, 512Kb (Winchester, D0) Intel Pentium 4 540 3200MHz, 1024Kb, (Prescott, E0)
Кулер: PENTAGRAM FREEZONE QVC-120 Cu+
Термопаста: Thermaltake Thermal Grease #2 (Arctic Silver 5)
Оперативная память: 2 x 512Mb DDR PC3200 2 x 512Mb DDR2 PC4300
Patriot XBLK Corsair CM2X512A
200(400)MHz, 2-2-2-5  266(533)MHz, 3-2-3-3
Видеокарты: 2 х MSI GeForce NX6800-TD256E 256Mb (MS-8984)
MSI Radeon RX850XT-VT2D256E 256Mb (MS-8990)
Дисковая подсистема: 160Gb IDE Seagate Barracuda 7200.7 (3160023A) 7200RPM 8Mb
Привод: DVD±R/RW & CD-RW NEC ND-3520A firmware v.1.05
Корпус системного блока: INWIN-S508 + блок питания 420W (Thermaltake-W0009) + два корпусных 80-мм кулера Zalman (~1400RPM, 7v.)

Учитывая, что процессоры относительно слабы для тестирования скорости двух GeForce 6800 в режиме SLI, оба CPU были разогнаны: максимум для AMD Athlon 64 3200+ степпинга D0 составил 2500MHz при напряжении 1.55v.:

Intel Pentium 4 смог стабильно работать на 4000MHz при напряжении 1.5385v.:

Оперативная память DDR PC3200 Patriot XBLK при разгоне AMD Athlon 64 работала на 209 (418) MHz с таймингами 2-2-2-5-1T. Как показало предварительное тестирование, такой режим оказался быстрее, чем на 250 (500) MHz с таймингами 2.5-3-3-5-2T (а более низкие тайминги на этой частоте память уже "не тянула"). На платформе с процессором Intel Pentium 4 частота работы оперативной памяти DDR 2 была зафиксирована на стандартной для неё отметке 266 (533) MHz, при этом тайминги её работы удалось понизить до 3-2-3-3, что явно нетипично для данного типа памяти и заметно прибавляет в скорости системы в целом.





Видеокарты GeForce 6800 были разогнаны до 425/855MHz как при работе в режиме SLI, так и при одиночном режиме тестирования.

Все тесты были проведены в операционной системе Windows XP Home Edition SP2, установленной на первый раздел жесткого диска размером 5Gb. В свою очередь, бенчмарки и игры были установлены на второй раздел винчестера размером в 30Gb. Чтобы минимизировать влияние на итоговые результаты прочих программных факторов, во время проведения тестов все лишние сервисы, за исключением 4-х, необходимых для нормального функционирования операционной системы, были отключены. Никаких дополнительных программ также не устанавливалось ("чистый трэй"). Система настроена на максимальное быстродействие.

Тесты выполнялись с использованием системных драйверов Intel Chipset Software Installation Utility версии 6.3.0.1008 и библиотек DirectX 9.0с. Что же касается драйверов для видеокарт GeForce 6800, то, помня неработоспособность драйверов версии 76.10 в режиме SLI в игре The Chronicles Of Riddick: Escape From Butcher Bay, специально для проведения тестирования были скачаны еще две относительно свежих версии драйверов Force Ware 72.01 и 76.50. Приятно, что в обеих версиях режим SLI в игре The Chronicles Of Riddick: Escape From Butcher Bay оказался работоспособен и, главное, заметно прибавлял в скорости в сравнении с одной GeForce 6800, но при проведении тестов на версии Force Ware 76.50 вновь приходилось прибегать к помощи последней версии программы RivaTuner и принудительно использовать библиотеки OpenGL версии 1.3. Кроме того, результаты тестов на драйверах версии 72.01 в данной игре оказались несколько выше, чем показатели FPS на 76.50. Учитывая, что во всех остальных играх и синтетических бенчмарках 76.50 показывает более высокую производительность, было решено использовать именно данную версию, но The Chronicles Of Riddick: Escape From Butcher Bay все же тестировался на Force Ware 72.01. Надеюсь, что Вы отнесетесь снисходительно к таким "выкрутасам" с драйверами при тестировании. Хочется всегда выжать максимум из тестовой системы.

Как показали предыдущие тесты режима SLI в играх, использование анизотропной фильтрации не влечет за собой заметное снижение производительности, поэтому от тестов просто в чистом режиме "Quality" было решено отказаться. В результате тестирование было проведено в 32bit-ном цвете в двух разрешениях: 1024х768 и 1280x1024, и при двух режимах настроек драйверов:

  1. Режим "Quality+AF16x" – настройки драйвера на "Quality", VSync Off, AF16x, AA Off;
  2. Режим "Quality+AF16x+AA4x" – настройки драйвера на "Quality", VSync Off, AF16x, AA4х.

Оптимизации трехлинейной и анизотропной фильтрации в драйверах NVIDIA во время тестирования были активированы.

Выбор метода рендеринга режима SLI: AFR или SFR?

Одной из особенностей режима SLI является возможность выбора пользователем в панели управления драйверов Force Ware метода рендеринга: AFR (alternate-frame rendering, или "рендеринг с чередованием кадра"), либо SFR (split-frame rendering, или "рендеринг с разделением кадра"):

В случае выбора пользователем режима AFR, подготовленные попеременно видеокартами кадры выдаются на экран непрерывно, при интенсивном использовании кадрового буфера. В сравнении с режимом SFR, alternate-frame rendering обеспечивает более высокий прирост производительности в большинстве бенчмарков и игр. Тем не менее, для полного раскрытия потенциала данного режима необходимо выполнение, как минимум, двух условий: наличие мощного центрального процессора и, так сказать, отточенность драйверов (здесь также нельзя упомянуть про специфику игровых приложений и бенчмарков, проще говоря, поддержку ими режима SLI). Если соблюдение первого условия для владельцев двух видеокарт уровня 6800 и выше, а также материнской платы стоимостью под 200$ (а то и более) не должно являться существенной проблемой, то вот с драйверами вопрос до сих пор до конца не решен. Но об этом подробнее я скажу чуть ниже.

Режим SFR формирует картинку, разделяя сцену, выводимую на монитор, на две части, процентное соотношение которых меняется динамически. Так, например, в один момент времени верхние 40% экрана может рендериться первой видеокартой, а 60% - второй. В следующую секунду ситуация меняется и процентное соотношение уже 39% на 61%, например. "Благодаря" багам в драйверах Force Ware как версии 72.01, так и 76.50 в Far Cry и The Chronicles of Riddick: EFBB (здесь только на 72.01) на неразогнанном процессоре AMD Athlon 64 3200+ (2000MHz) при использовании режима SFR можно было наблюдать плавающую горизонтальную полосу, которая и являлась границей совместного рендеринга двух GeForce 6800 в режиме SLI. При разгоне процессора до 2500MHz подобных дефектов изображения не наблюдалось. Странно, что это происходило именно в режиме SFR, который теоретически должен быть менее процессорозависим, чем режим AFR.





Посмотрим, какой же режим окажется наиболее быстрым и наименее процессорозависимым:

GeForce 6800 SLI (425/855MHz) & AMD Athlon 64 3200+ (2000MHz)
Benchmark’s & Games Resolution Quality + AF16x Quality + AF16x + AA4x
AFR SFR AFR SFR
3DMark 2003 1024x768 15 416 15 392 11 214 11 205
3DMark 2005 7 776 7 918 - 8 156
Aquamark 3 68.0 68.0 66.9 67.1
Far Cry 1024x768 78.9 78.1 78.5 77.5
1280x1024 77.7 77.2 75.3 75.2
DOOM 3 1024x768 87.7 96.0 88.3 88.3
1280x1024 80.6 92.2 57.6 57.3
Half-life 2 1024x768 100.0 106.6 102.9 103.0
1280x1024 100.3 100.2 88.8 88.6
The Chronicles of Riddick: EFBB 1024x768 134.9 58.5 80.0 30.3
1280x1024 100.6 46.8 52.7 21.3
* – полужирным шрифтом отмечены лучшие результаты.

Если производительность двух видеокарт в режиме SLI ограничивается скоростью центрального процессора, то без активации полноэкранного сглаживания режим SFR оказывается быстрее в обоих разрешениях в DOOM 3, в разрешении 1024x768 в Half-life 2 и в 3DMark 2005. Что же касается провала скорости данного режима в игре The Chronicles of Riddick: EFBB, то можно было бы возложить вину на движок игры или некорректность работы драйверов Force Ware, если бы не результаты режима SFR после разгона процессора... В остальных играх и бенчмарках наблюдается примерный паритет.

При активации полноэкранного сглаживания, за исключением опять же The Chronicles of Riddick: EFBB, результаты выровнялись еще больше. Но проблемой здесь стал стабильный вылет 3DMark 2005 при тестировании в режиме AFR. В итоге мне так и не удалось получить в данном бенчмарке результат при AA4x, причем как на драйверах версии 72.01, так и версии 76.50.

Теперь оценим, насколько изменятся результаты тестирования после разгона процессора на 25%.

GeForce 6800 SLI (425/855MHz) & AMD Athlon 64 3200+ @2500MHz
Benchmark’s & Games Resolution Quality + AF16x Quality + AF16x + AA4x
AFR SFR AFR SFR
3DMark 2003 1024x768 15 890 15 900 11 488 11 484
3DMark 2005 8 545 8 508 8 472 8 484
Aquamark 3 79 78.9 76.9 76.9
Far Cry 1024x768 80.4 80.4 80.3 80
1280x1024 79.5 80.1 72.2 72.3
DOOM 3 1024x768 113.3 113.4 96.5 96.4
1280x1024 105.5 107.2 61.2 61.2
Half-life 2 1024x768 100.3 110.2 103.5 103.9
1280x1024 96.9 97.2 81.6 81.9
The Chronicles of Riddick: EFBB 1024x768 127.7 127.6 72.4 72.4
1280x1024 91.6 91.5 48 48
* – полужирным шрифтом отмечены лучшие результаты.

Очень незначительное, но все же преимущество рендеринга с разделением кадра (SFR). При этом обратите внимание, что результаты The Chronicles of Riddick: EFBB режимов AFR и SFR выровнялись. Я специально проверил логи тестов, не перепутаны ли в таблицах колонки AFR и SFR, но оказалось все правильно.

Теперь несколько слов о рендеринге с чередованием кадра (AFR). Пришлось отказаться от выбора данного режима работы SLI в дальнейших тестах в силу его большей глючности по сравнению с SFR. При использовании AFR картинка частенько просто рвется, в играх нередко наблюдаются рывки и артефакты. Не замечено дефектов изображения только в 3DMark 2003, в Unreal Tournament 2004 и Splinter Cell (результаты тестов последних двух не привожу, вследствие их очень высокой процессорозависимости). Кроме того, оба режима были проверены в играх Ил-2 Штурмовик: Пёрл Харбор и Brothers in Arms. В итоге при проведении дальнейших тестов было решено остановиться на использовании рендеринга с разделением кадра (SFR), как наиболее стабильном и не уступающем в скорости конкуренту в лице AFR. Остается надеяться, что более перспективный AFR-режим в скором времени все же получит "допинг" в виде новых исправленных и быстрых драйверов Force Ware.

Прирост производительности режима SLI платформ на базе AMD и Intel

Заранее необходимо сказать, что задачи сравнить производительность процессоров AMD и Intel в контексте данного тестирования не стоит, говориться в статье об этом не будет и обсуждению в соответствующей ветке конференции так же не подлежит. Главное в сегодняшнем тестировании – оценить, на какой платформе режим SLI работает эффективнее и где прирост производительности от перехода к использованию связки из двух разогнанных GeForce 6800 выше. В тестах вне конкурса также принимает участие уже знакомый Вам ранее MSI Radeon X850XT разогнанный до 555/1250MHz (GPU/memory) с использованием драйверов Catalyst 5.4 и всеми активированными оптимизациями в них.





Дабы не загружать Вас лишними диаграммами и, учитывая, что разрешение 1280 x1024 является наиболее показательным и менее зависимым от скорости центрального процессора, ниже будут приведены только диаграммы с результатами тестирования в играх в разрешении 1280x1024. Тем не менее, линки на диаграммы в разрешении 1024x768 я буду приводить в каждом разделе тестов. Так как оба 3DMark-а и Aquamark 3 тестировались только в разрешении 1024x768, то результаты в данных синтетических и полусинтетических бенчмарках будут приведены именно в этом разрешении.

3DMark 2003

При тестировании был использован последний build 3.6.0 бенчмарка. Тесты в данном синтетическом пакете были проведены только в одном разрешении – 1024x768, при активированной анизотропной фильтрации уровня 16x и затем, в дополнение к ней, еще и полноэкранного сглаживания уровня 4x. Посмотрим, что получилось:

Как в режиме с активированным полноэкранным сглаживанием, так и без него небольшое преимущество в приросте производительности от перехода к режиму SLI находится на стороне платформы Intel (0.9%-2.1%).

3DMark 2005

Так же как и в предыдущем случае 3DMark был пропатчен до последней на момент написания статьи версии 1.2.0. Одно разрешение – 1024x768 и аналогичные 3DMark 2003 режимы качества графики:





В 3DMark 2005 мы уже можем наблюдать иную картину: SLI работает эффективнее на платформе на базе процессора AMD Athlon 64, причем преимущество в обоих режимах качества графики составляет здесь уже около 12%.

Aquamark 3

В Aquamark 3 сохраняется паритет, очевидного преимущества нет ни у одной платформы.

Переходим к результатам тестирования в играх и их анализу в разрешении 1280x1024.

Far Cry

В качестве тестовой демки была выбрана демо-запись "Training" уровня с одноименным названием от Ubisoft. Версия игры – 1.31 (build 1337), максимальная детализация, два последовательных прогона бенчмарка. Технологии "Geometry Instancing" и сжатия карт нормалей ("Normal-maps compression") во время тестирования были активированы.

Far Cry v.1.31 1024x768
Quality + AF16x Quality + AF16x + AA4x

Как и в 3DMark 2005, в Far Cry режим SLI чуть больше благосклонен к платформе AMD. Прирост производительности от перехода к совместной работе двух видеокарт при использовании анизотропной фильтрации уровня 16x на платформе с процессором AMD Athlon 64 превышает на 2.3% прирост производительности на платформе с процессором Intel. При активации полноэкранного сглаживания этот разрыв увеличивается до 3.6%. Здесь необходимо учесть, что в абсолютных показателях система с процессором Intel Pentium 4 и DDR2 оперативной памятью показывает более высокую производительность. Можно предположить, что при равной производительности платформ преимущество в приросте производительности от перехода к режиму SLI еще несколько вырастет в пользу AMD.

DOOM 3

Для тестов использовалось стандартное демо "demo1" при детализации графики в самой игре – "Ultra Quality" и, также как и в Far Cry, двойном прогоне демо-записи.

DOOM 3 1024x768
Quality + AF16x Quality + AF16x + AA4x

Довольно интересные результаты можно наблюдать в DOOM 3. Когда полноэкранное сглаживание не используется, SLI эффективнее работает на платформе с процессором AMD: +28.4FPS (+36.4%) против +21.8FPS (+27.5%) на Intel Pentium 4 (сказывается всем известное преимущество в скорости в играх процессора AMD). Но стоит только включить AA4x, увеличив тем самым нагрузку на графическую подсистему, как впереди уже оказывается Intel: +29.9FPS (+69.4%) против +23.6FPS (+59.9%) на AMD – разрыв достигает 10%.

Half-life 2

Все тесты проводились на демо-записи d1_town_01 и при максимальных настройках графики в самой игре.

Half-life 2 1024x768
Quality + AF16x Quality + AF16x + AA4x

В Half-life 2 небольшое преимущество в обоих режимах качества графики на стороне платформы на базе процессора AMD Athlon 64. Вновь в данной игре отлично смотрится Radeon X850XT.

The Chronicles of Riddick: EFBB

Максимальная детализация, Shader 2.0, demo_ducche.

The Chronicles of Riddick: EFBB 1024x768
Quality + AF16x Quality + AF16x + AA4x

В The Chronicles of Riddick: EFBB прирост производительности на обеих платформах одинаков, разница находится в пределах погрешности.

Подведем итоги.

Заключение

Посмотрим на результаты прироста производительности при переходе к режиму SLI всех бенчмарков и игр в двух разрешениях и двух режимах качества графики на платформах на базе процессоров AMD Athlon 64 и Intel Pentium 4 в одной таблице*:

Benchmark’s & Games Resolution Quality + AF16x Quality + AF16x + AA4x
AMD Athlon 64 3200+ @ 2500 MHz Intel Pentium 4 3.2 GHz @ 4000 MHz AMD Athlon 64 3200+ @ 2500 MHz Intel Pentium 4 3.2 GHz @ 4000 MHz
3DMark 2003 1024x768 64.9% 65.8% 71.3% 73.4%
3Dmark 2005 85.1% 73.1% 85.2% 73.9%
Aquamark 3 21.2% 23.2% 33.0% 32.9%
Far Cry 1024x768 6.1% 6.2% 24.0% 21.1%
1280x1024 31.0% 28.7% 54.4% 50.8%
DOOM 3 1024x768 11.9% 4.6% 56.1% 47.6%
1280x1024 36.4% 27.5% 59.9% 69.4%
Half-life 2 1024x768 7.4% 1.5% 25.0% 19.9%
1280x1024 37.6% 32.9% 49.2% 46.1%
The Chronicles of Riddick: EFBB 1024x768 71.7% 63.2% 82.4% 82.1%
1280x1024 80.3% 80.5% 85.5% 85.6%
Average % (games only) 1024x768 24.3% 18.9% 46.8% 42.7%
1280x1024 46.3% 42.4% 62.3% 63.0%
* – полужирным шрифтом отмечены лучшие результаты.

В большинстве случаев платформа на базе процессора AMD Athlon 64 работает с режимом SLI эффективнее своего конкурента. Нельзя сказать, что разница критична, но уж то, что заметна – это точно. Добавлю еще раз – здесь необходимо учитывать, что в контексте данного тестирования платформа AMD оказалась немного медленнее, чем Intel ("лакмусовой бумажкой" являются результаты разогнанного Radeon X850XT). Тем не менее, это не помешало ей обойти грозного соперника в приросте производительности от перехода к использованию связки из двух GeForce 6800. Думаю, что при равной производительности платформ преимущество AMD должно еще немного вырасти.

В заключение нельзя не сказать о том, что на сегодня производительность режима SLI в большей степени зависит от корректности работы драйверов NVIDIA, которые, как при использовании метода рендеринга AFR так и SFR, оставляют желать лучшего. С другой стороны – когда есть что оптимизировать и улучшать на программном уровне, это интереснее и дешевле чем менять что-то аппаратно :). Судя по появляющейся в последнее время чуть ли не каждый день в новостной ленте информации о технологии компании ATI Multi-Rendering, являющейся конкурентом режима SLI от NVIDIA, тонкостей и "подводных камней" в ней будет не меньше...

Ваши замечания и предложения по сегодняшней статье предлагаю обсудить в соответствующей ветке конференции.

Сергей Лепилов aka Jordan

Telegram-канал @overclockers_news - это удобный способ следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Страницы материала
Страница 1 из 0
Оценитe материал
рейтинг: 4.1 из 5
голосов: 16


Возможно вас заинтересует

Популярные новости

Сейчас обсуждают