Титаны прошлого: тестирование процессоров Opteron 175 и Athlon64 Х2 3800+

2 июня 2007, суббота 17:09
для раздела Блоги
В этой статье мы продолжим изучение низкоуровневых характеристик процессоров AMD, а так же и не обойдемся без изучения их разгонного потенциала и тестирования на производительность в синтетических тестах и реальных приложениях. Не смотря на то, что исследуемые процессоры предназначены для платформы Socket 939, не будем забывать, что производительность платформ АМ2 не всегда сильно превосходит производительность аналогичной системы, построенной на процессорах под Socket 939. К неоспоримым плюсам процессоров под АМ2 можно отнести их доступность в продаже, чего уже не скажешь о двухъядерных процессорах под Socket 939.
Итак, перейдем к изучению процессоров, принявших участие в этом обзоре.

Данный процессор уже изучался в статье «Venus, Venice и Manchester. Тестирование процессоров Opteron144, Ahtlon64 3000+, Athlon64 X2 3800+», поэтому подробно про него рассказывать второй раз не имеет смысла, ограничусь кратким описанием.





Процессор основан на ядре Manchester и упакован на 3-й неделе 2006 года.

Второй процессор возможно будет более интересен, и вот по каким причинам. Во- первых он все еще выпускается, в отличии от Athlon64 X2. Во-вторых, обладает большим объемом L2 кэша, особенности которого будут подробно рассмотрены. А также процессоры Opteron ценятся оверклокерами за обычно хороший разгонный потенциал. И так, второй участник – Opteron 175.



Процессор упакован 50-й неделе 2005 года, так что он даже старше соперника.
Коллеги с форума xtremesystems.org во время популярности этих процессоров собрали довольно большую статистику по разгону этих процессоров в зависимости от их маркировки, а особенно 3-ей ее строки. Но по каким-то причинам никакой информации о процессорах Opteron модели 175 там нет. Видимо, как и всем оверклокерам, им в первую очередь были интересны самые младшие процессоры семейства, коим является 165-я модель. По этой модели там есть исчерпывающая информация.

Рассмотрим более подробно технические характеристики процессоров и их основные отличия.

Наиболее явными отличиями являются номинальная частота процессоров и, соответственно, максимальный множитель, и объем кэша L2. Также отличаются стэппинги ядер. Есть отличия и в теплоэлектрических характеристиках: у Opteron увеличена максимальная сила тока, как в номинальном, так и в энергосберегающем режимах, увеличен тепловой пакет (TDP) и снижена максимальная температура.
С различиями между стэппингами Вы можете ознакомиться в соответствующем datasheet.
Теперь перейдем к оверклокерским способностям процессоров.
Для выявления максимальной частоты стабильной работы был выставлен режим работы памяти как DDR133, множитель HTT понижен до х3. Проверка на стабильность работы при разгоне производилась утилитой S&M 1.76, мониторинг температур осуществлял SpeedFan 4.28. Напомню, плата способны держать частоту шины на уровне 333MHz, так что она вряд ли станет препятствием в разгоне.
Athlon 64 X2 3800+ уже был протестирован на разгон в вышеуказанном материале. Однако максимальную частоту его стабильной работы удалось повысить до 2550 MHz при напряжении 1,68v. Еще раз посетуем на плохой разгон ядер Manchester.
Второй процессор, Opteron 175, разгонялся немного лучше, хотя все же не дотянул до значений, показываемых другими его родственниками. Он успешно разогнался до частот около 2750MHz при поднятии напряжения до 1,62v, но дальнейший его разгон вероятнее всего сдерживался температурными показателями, т.к. разогревается Opteron заметно сильнее своего сегодняшнего соперника. Температура его стремительно росла, приближаясь к угрожающим 70° С и дальнейшие эксперименты по его разгону решено было прекратить.





Определив разгонный потенциал процессоров, обозначим режимы тестирования. Для Opteron множитель был искусственно занижен до значения х10 – максимального для Athlon64 X2 3800+, чтобы тестирования проводились при максимально близких настройках.
    •CPU 2000 MHz (200x10), HTT x5, режим работы памяти DDR233, результирующая частота памяти 446 MHz, напряжение на процессоре не изменялось;
    •CPU 2550 MHz (255x10), HTT x4, режим работы памяти DDR183, результирующая частота 464 MHz, напряжение на процессорах: 1,68v для Athlon 64 X2, и 1,61v для Opteron 175.
Как видите, максимальной частотой, на которой проводились тесты, стала максимальна частота для Athlon 64 X2. Тестировать лишь один процессор Opteron на максимальной его частоте я не стал. Так же отмечу, что между режимами тестирования немного различается частота памяти – подобрать ее одинаковую, когда для выставления используются делители довольно проблематично. Просто будем учитывать, что небольшой вклад в результаты разогнанных процессоров вносит повышенная частота памяти.





Конфигурация тестового стенда и методика тестирования.
    •Материнская плата: MSI K8N Neo4 Platinum (nForce4 Ultra), BIOS v1.D Mod by MurdoK
    •Оперативная память: 2х512Mb Hynix D43, dual channel, 2,5-3-3-6, Т1, 2,6v
    •Видеокарта: Sapphire ATI Radeon X800GTO @500/1200MHz (частоты установлены в BIOS видеокарты) + Zalman VF700-CU
    •Система охлаждения CPU: IceHammer IH-3775WV
    •Термопаста: КПТ-8
    •HDD: 160Gb SATA Western Digital WD1600PD, 8Mb; 320Gb SATA-II Western Digital WD3200YS RAID Edition, 16Mb;
    •Приводы: DVD±R/RW Plextor 716A;
    •Блок питания: 525W HIPER HPU-4S-525, ATX2.2
    •Корпус: Chieftec DA-01WD, FullTower, ATX + 2 корпусных вентилятора (80х80 мм GlacialTech GT80252BDL-1 на вдув и охлаждение HDD на передней панели, 120х120 мм GlacialTech GT12252BDL-1 на выдув над блоком питания)


Все тесты проводились при одной открытой боковой крышке корпуса. На чипсете сменён стандартный кулер на более высокий алюминиевый с медленным вентилятором 40х40 мм. С&Q отключен, в BIOS материнской платы отключено автоматическое регулирование оборотов процессорного кулера. Использовалась операционная система Windows Server 2003 Enterprise Edition, без установки SP1, установленная на отдельный раздел жесткого диска объёмом 6,15 Гб. Тестовые программы и игры установлены на отдельный раздел объемом 100 Гб на одном физическом диске с ОС. Под файл подкачки выделен раздел на втором физическом диске (WD3200YS). Серверные и не критичные для функционирования операционной системы службы были отключены, быстродействие системы оптимизировано для программ. Установлены: DirectX 9c (Apr2006), nForce4 driver 6.69 for windows 2003, ATI Catalyst 6.12

Набор тестовых пакетов и программ:
    •RightMark Memory Analyzer 3.65, RightMark Multi-Threaded Memory Test;
    •SuperPI mod1.4 – расчет числа «пи» с точностью до 1 и 4 млн. знаков;
    •CPU RightMark Lite 2005 – тестовая модель 1, разрешение 800х600;
    •WinRAR 3.60 beta 7 – метод сжатия «Наилучший» (Best), Создание непрерывного архива, трехкратный тест, среднее последних двух результатов;
    •7-Zip 4.43 beta – трехкратный тест, среднее последних двух результатов;
    •3ds max 7 – тестовый пакет SPECapc for 3ds max 7 v2.1.3, трехкратный тест, среднее последних двух результатов;
    •Video Encoding – кодирование в Dr.DivX v1.0.6 build 105
    •3DMark06 v1.0.2 – только CPU тесты;
    •Quake 4 v1.3 build 2393 - Open GL демо-запись "d5", четырёхкратный прогон демо, бралось среднее из трех последних результатов;
    •Half-Life 2 v1.0.1.0 - DirectX 9.0c, для тестирования выбрана демо-запись "ixbt01", трехкратный прогон демо-записи, бралось среднее значение;
    •Prey – демо-запись взята из тестового пакета HardwareOC Prey Benchmark, четырехкратный прогон демо, среднее из трех последних результатов;
    •FarCry v1.4 build 1405 - DirectX 9.0c, запуск игры с параметром “Devmode”, уровень Volcano, встроенная демо-запись, четырехкратный прогон демо, бралось среднее из трех последних результатов;
    •F.E.A.R. v1.01 - DirectX 9.0c, встроенный бенчмарк, трехкратный прогон теста, бралось среднее значение.


В целях снижения влияния на результаты производительности видеокарты в игровых тестах использовались разрешения 640х480 и 800х600 (в FarCry только 800х600) при минимальных настройках качества. В настройках игр, где это возможно выставлялась трилинейная фильтрация. 3DMark06 в CPU тестах автоматически снижает разрешение до 640х480.

Результаты тестирования


Исследование низкоуровневых характеристик

Тестирование проводилось с помощью пакета RMMA 3.72, который в том числе содержит приложение RMMT для исследования подсистемы памяти при использовании двухъядерных процессоров.
Средняя латентность кэшей L1 и L2, а так же латентность памяти у процессоров одинаковые и составляют соответственно 3 и 12 циклов для КЭШей, а латентность памяти зависит от того, какая операция производится.
Пропускная способность шины L1 – L2 оказалась практически одинаковой, а вот ПС шины L2 – RAM Opteron оказалась меньше чем у Athlon64 X2 на 180 – 190 МБ/с при операциях чтения и на 80 – 90 МБ/с при записи.




Средняя и максимальная пропускная способность при использовании различных регистров и оптимизаций чтения данных из памяти отличается крайне не значительно, в некоторых случаях разница составляет до 50 МБ/с в пользу Athlon64 X2 и в основном проявляется при операциях чтения данных.




Средняя пропускная способность памяти при использовании регистров SSE2.

А теперь рассмотрим результаты, показанные в RMMT. Здесь тест проводился со следующими настройками: Lock Virtual Memory Pages и Set Threads Affinity to Cores включены, использовались регистры 128-bit SSE2. Настройки Read и Write позволяют оценить пропускную способность кэша L2, для каждого из ядер выделялся блок данных равный объему кэша L2, 512 и 1024Kb для Athlon64 X2 3800+ и Opteron 175 соответственно. Настройки Read w/PF и Write NT позволяют оценить пропускную способность памяти и используют оптимизации в виде предвыборки данных для операции чтения и прямой записи данных соответственно для операции записи. Дистанция предвыборки выставлялась 1024Б.



Так как каждое ядро имеет независимый кэш уровня L2, в тестах Read и Write пропускная способность каждого КЭШа не зависит от того, одно или два ядра одновременно делают запросы к данным, удваивается лишь общая ПС при активации обоих ядер. Разница в ПС кэша L2 между процессорами минимальна и вполне укладывается в погрешность измерений.
При доступе к данным, находящимся в оперативной памяти, наблюдается обычная картина сокращения ПС на каждое ядро примерно в 2 раза при одновременном доступе двух ядер. А так же при обращении двух ядер сокращается и общая ПС шины памяти, по сравнению с одноядерным обращением, примерно на 10% при операциях чтения с предвыборкой и на 3% при прямой записи. В абсолютных значениях разница между процессорами так же укладывается в погрешность измерений, за исключением случая чтения с предвыборкой данных, где она составляет около 2% в пользу Athlon64 X2.
Далее перейдем к тестированию общей производительности систем.

SuperPI mod1.4





Хоть сколько-нибудь заметное и стабильное преимущество Opteron’а можно обнаружить только при расчете числа Пи с точностью до 4М и оно составляет около 1 %. Как известно, это «кэшенезависимый» для процессоров AMD тест.

CPU RightMark Lite 2005






И этот синтетический тест относится к объему кэша абсолютно равнодушно, поэтому процессоры показывают одинаковые результаты в обоих модулях программы.

3DMark




В 3DMark большой кэш дает около 0,8 дополнительных %, что вполне можно списать на погрешность теста, как в прочем и различия в других, проведенных до этого тестах.

А теперь перейдем к результатам тестирования в реальных приложениях. Может быть они нам покажут что-то интересное…

WinRAR

В тестах архивирования использовался тот же набор файлов, содержащий файлы форматов .dll, .bmp, .txt, .bin, .xls, .doc, .pdf общим объемом 164Мб, что и в предыдущем тестировании.



А вот и первое положительное проявления большого кэша. В этом архиваторе Opteron показывает преимущество в 3,5%, которое увеличивается при повышении частоты работы процессоров до 8%.

7-Zip

7-zip позволял выбирать режим архивирования между одно- и мультипроцессорным режимами, поэтому процессоры были протестированы в обоих режимах. Однопоточный способ архивирования отмечен на диаграммах как “1 thr”.





И в этом архиваторе большой кэш дает прирост в 4,5 – 5,5%, но он уже не зависит от частоты процессоров, и более того, переход в однопоточный режим никак на результаты не повлиял. И так, архиваторы показали зависимость от объема кеша на архитектуре К8. Примерно такая же разница в результатах была и между одноядерными процессорами.

Video Encoding




Здесь мы видим разницу между процессорами порядка двух секунд, что составляет около 1%, причем в независимости от частоты их работы.

3ds max 7

В отличии от прошлого тестирования процессоров, на этот раз использовался только тест рендеринга Rendered - Generated Textures.


И на этот раз сколько-нибудь заметного преимущества большого кэша не видно, различия в результатах можно отнести к погрешности тестирования.

Пока что из всех проведенных выше тестов мы увидели более-менее заметное преимущество (в районе 5%) процессора с большим кэшем только в тестах архивирования. Другие, как синтетические, так и реальные приложения оказались к объему кэша практически безразличны. У Opteron’ов остается последний шанс отыграться – приступаем к результатам тестирования в играх.

Half Life 2






В этой, уже достаточно не новой игре, наконец-то Opteron показывает достойный отрыв от соперника, 7-9,5%, который не зависит от разрешения. Примерно та же картина, только с чуть большим преобладанием, наблюдалась в соперничестве одноядерных процессоров.

Far Cry




Здесь так же видим преимущество большого кэша в виде 4-6%. Больше, собственно, комментировать нечего.

Quake 4





В Quake 4 разница в результатах уже уменьшается до 1,3 – 2,3%. Разрешение тестирования влияния не оказывает.

Prey






Эта игра сделана на том же игровом движке что и Quake 4, поэтому я ожидал и похожих результатов. Мои ожидания оправдались, максимальный отрыв от конкурента, показанный Opteron’ом, составил 2,6%, снижаясь в других режимах до нуля.

F.E.A.R.






Здесь видим разницу в 2,9 – 5% - ее уже можно считать хоть сколько-нибудь заметной. Возможно с более быстрой видеокартой, способной сильнее нагружать процессор, выигрыш был бы больше. Минимальный показатель fsp здесь как всегда от производительности процессора не зависит.

Call Of Duty 2






В этой игре получить стабильного преимущества или отставания не получилось, не смотря на многочисленное повторение тестов. Диапазон различий лежит в пределах от 3,3% отставания, до 7,1% преимущества Opteron 175 над Athlon64 X2.
Далее привожу сводную таблицу различия результатов двух процессоров в относительном выражении (в %).



Еще раз замечу, что все выше приведенные игровые тесты проводились на очень низких разрешениях и с минимальным качеством графики, чтобы максимально снять влияние видеокарты на результаты. На этот раз я решил включить в тестирование и более приемлемые для повседневного использовании настройки графики: разрешение 1024*768, включена анизотропная фильтрация x16. Настройки системы: частота CPU 2550 MHz, частоты видеокарты 580/1260 MHz. Тестирование проводилось только в некоторых играх. Итак взглянем на результаты.



С увеличением нагрузки на графическую подсистему ситуация в различных играх меняется по разному. В Quake 4 практически все остается на своих местах, так как и при более слабых настройках графики разница между результатами была минимальная. Одинаковую производительность показывают системы и в F.E.A.R., но здесь уже заметна разница от настроек графики – при низких настройках показатели Opteron’а были на 3-5% выше. А вот старые добрые Half Life 2 и Far Cry порадовали, с усложнением графического режима разница между результатами процессоров увеличилась.

Заключение
На этом закончим сегодняшний обзор процессоров под Socket 939. Надеюсь, вышеприведенные исследования кому-то помогут определиться, стоит ли искать процессоры AMD с большим кэшем L2 или остановиться на более дешевом и распространенном варианте к кэшем 2*512 Kb. Приведенные выше результаты с большой долей уверенности можно относить и к процессорам под Socket AM2, выполненным по 90 нм технологии. В них с переходом на другой сокет был изменен только контроллер памяти, поэтому показатели работы с памятью будут отличаться, а вот выигрыш от объёма кэша нет. Но к процессорам, произведенным по 65 нм технологии эти данные уже применить нельзя, в них с переходом на более тонких техпроцесс были изменены тайминги кэшей, кроме того по 65 нм техпроцессу выпускаются двухъядерные процессоры только с 2*512 Кб кэшем.

Обсудить материал можно в соотвестсвующей ветке конференции

С уважением, Александр Смирнов aka HellraiseR
Оценитe материал

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают