AM2. Тайминги или пропускная способность памяти?

При использовании процессоров от AMD тайминги всегда считались особенно важными. Согласно расхожему мнению, именно низкие тайминги способны дать больший прирост производительности на этой платформе, нежели банальное увеличение частоты памяти, влекущее за собой увеличение пропускной способности. Оценить этот прирост в популярных приложениях на свежеиспеченой АМ2 и призвана статья, предлагаемая Вашему вниманию. <br/> <br/>В роли подопытного выступала следующая система: <br/> <br/>Athlon 64 X2 AM2 3800+@2390MHz (239x10) <br/>Box Cooler & КПТ-8 <br/>ASUS M2N-E, BIOS ver. 103 <br/>2x512 DDR2-800 Transcend <br/>ASUS EN7600GT <br/>Zalman VF700 AlCu & Zalman grease <br/>Hitachi T7K250 2x160Gb SATA 8mb <br/>Zalman ZM-F2 <br/>HPC-500-A12S <br/>Chieftec CH-01B-B-SL <br/>Thermaltake Smart Case Fan Blue LED...
23 октября 2006, понедельник 13:38
gloomdemon для раздела Блоги
При использовании процессоров от AMD тайминги всегда считались особенно важными. Согласно расхожему мнению, именно низкие тайминги способны дать больший прирост производительности на этой платформе, нежели банальное увеличение частоты памяти, влекущее за собой увеличение пропускной способности. Оценить этот прирост в популярных приложениях на свежеиспеченой АМ2 и призвана статья, предлагаемая Вашему вниманию.
В роли подопытного выступала следующая система:
Athlon 64 X2 AM2 3800+@2390MHz (239x10)
Box Cooler & КПТ-8
ASUS M2N-E, BIOS ver. 103
2x512 DDR2-800 Transcend
ASUS EN7600GT
Zalman VF700 AlCu & Zalman grease
Hitachi T7K250 2x160Gb SATA 8mb
Zalman ZM-F2
HPC-500-A12S
Chieftec CH-01B-B-SL
Thermaltake Smart Case Fan Blue LED 120 mm
Тестирование проводилось под управлением Windows XP с установленным Service Pack версии 2. На протяжении всех тестов на память подавалось напряжение 1,95В - максимально возможное на ASUS M2N-E.
Немного об использованных приложениях:
AIDA32 3.94.2
Sisoft Sandra Lite 2007.8.10.105
SuperPi mod 1.5 XS
3DMark01 SE build 330
3DMark03 version 1.2.0
3DMark05
3DMark06 version 1.0.2
WinRar 3.61
7Zip 4.42 32М словарь
Driverheaven Photoshop Bench V2.0
fr-025: the.popular.demo 1024х768
Quake 4 patch 1.2 1280х1024, высокое качество
F.E.A.R. 1280х1024, настройки видео и CPU на максимум, без soft shadows и pixel doubling
Halflife 2 1280х1024, все настройки на максимум
Cinebench 9.5
ScienceMark 2.0

Driverheaven Photoshop Bench прогонялся посредством Photoshop CS2. Сглаживание и анизотропия были выключены в драйверах. SuperPi тестировался на обоих ядрах одновременно. Разумеется, поддержка двухъядерности в WinRar, 7Zip и Quake была включена. Настройки Марков оставлялись без изменений. Производительность в Halflife-2 оценивалась путем прогона демо d1_canals_09. В Quake-4 использовалась демка, взятая из HOC_Q4Bench (HOCdemo). Тестирование проводилось на тех частотах и таймингах, которые обеспечивали успешный прогон Orthos Prime длительностью 33 минуты, тест памяти S&M и 32M SuperPi. Также каждая конфигурация еще тестировалась на стабильность просчетом задачи 1495 из популярного проекта распределенных вычислений Folding@Home. То есть, можно утверждать о достаточно высокой стабильности системы в каждой конкретной конфигурации.
Ну что ж, к результатам...
Сразу следует отметить, что изложение некоторых результатов в графическом виде не имело бы смысла, ввиду достаточно небольшого их различия. Но, Мы то с Вами знаем, что именно от этих различий и зависит окончательная производительность компютера. Поэтому все данные будут представлены исключительно в виде таблиц. Здесь же стоит отметить еще одно немаловажное обстоятельство, о котором обычно не задумываются... А именно - тайминги и пропускную способность памяти (далее ПСП) нельзя сравнивать! Это абсолютно разные вещи. Нельзя сказать, что 4-4-4-8-12-2Т хуже частоты 667. Поэтому можно говорить лишь о разнице производительности, достигаемой при том или ином параметре. Ситуация еще усугубляется и тем, что одно зависит от другого - чем выше задирается частота, на которой работает память, тем хуже становяться тайминги и, наоборот, низкие тайминги не дают достичь высокой частоты. Поэтому Мы, сегодня, и будем говорить о разнице....
Для начала попытаемся оценить прирост производительности от изменения параметра Command Rate. Сравним производительность при 5-5-5-8-12-1Т и 5-5-5-8-12-2Т на частоте памяти 298 Мгц.
5-5-5-8-12-1Т
298 Мгц
5-5-5-8-12-2Т
298 Мгц
разница процент
прироста
AIDA read 5638 5479 159,00 2,90
AIDA write 1826 1784 42,00 2,35
Sandra Int 6086 5894 192,00 3,26
Sandra SSE2 6050 5853 197,00 3,37
SuperPi 39,297 40,391 -1,09 -2,71
3DMark01 23436 21270 2166,00 10,18
3DMark03 13116 13089 27,00 0,21
3DMark05 6027 5895 132,00 2,24
3DMark06 3296 3295 1,00 0,03
WinRar 962 923 39,00 4,23
7Zip 2615 2581 34,00 1,32
Photoshop 206,2 207,6 -1,40 -0,67
fr-025 48356 48001 355,00 0,74
Quake 59,3 59,3 0,00 0,00
F.E.A.R. 23/48/90 23/48/90
Halflife 79.32 79.47 -0.15 -0.19
Cinebench 647 643 4.00 0.62
ScienceMark 1266.60 1262.53 4.07 0.32

Как видно, наибольший прирост заметен в первом Марке, также неплохо отреагировал WinRar и целую секунду принес SuperPi. Игровые приложения, фактически, не отреагировали на изменение рассматриваемого параметра, равно как и Photoshop, Cinebench и ScienceMark. Насчет последних и неудивительно - общеизвестно, что они черезвычайно процессорозависимы.
Теперь рассмотрим прирост производительности, получаемый от уменьшения таймингов до 3-4-3-5-11-2Т с 5-5-5-8-12-2Т . Частота памяти составляла те же 298 Мгц.
3-4-3-5-11-2Т
298 Мгц
5-5-5-8-12-2Т
298 Мгц
разница процент
прироста
AIDA read 5908 5479 429.00 7.83
AIDA write 2066 1784 282.00 15.81
Sandra Int 6580 5894 686.00 11.64
Sandra SSE2 6536 5853 683.00 11.67
SuperPi 38.687 40.391 -1.70 -4.22
3DMark01 22101 21270 831.00 3.91
3DMark03 13184 13089 95.00 0.73
3DMark05 6043 5895 148.00 2.51
3DMark06 3292 3295 -3.00 -0.09
WinRar 1002 923 79.00 8.56
7Zip 2691 2581 110.00 4.26
Photoshop 203.9 207.6 -3.70 -1.78
fr-025 49225 48001 1224.00 2.55
Quake 59.5 59.3 0.20 0.34
F.E.A.R. 23/48/89 23/48/90
Halflife 80.00 79.47 0.53 0.67
Cinebench 646 643 3.00 0.47
ScienceMark 1296.78 1262.53 34.25 2.71

Прирост радикален и, практически по всем приложениям, превышает прирост получаемый от включения 1Т. Особенно выразительна разница в SuperPi, WinRar, 7Zip и fr-025. Стоит лишь отметить падение прироста производительности в 3DMark01 более чем в два раза.
Окрыленные успехом Мы сразу же начинаем с пеной у рта убеждать всех и вся о полезности таймингов для архитектуры К8, забывая, при этом, о таком немаловажном показателе как ПСП. А она то нам все карты и спутает. Возьмем и сравним производительность памяти при высоких таймингах и высокой шиной с наиболее агрессивными таймингами и медленной шиной. А именно 5-6-5-8-12-2Т на 478 Мгц и 3-4-3-5-11-1Т на 298 Мгц.
5-6-5-8-12-2Т
478 Мгц
3-4-3-5-11-1Т
298 Мгц
разница процент
прироста
AIDA read 6270 6033 237.00 3.93
AIDA write 2285 2005 280.00 13.97
Sandra Int 8198 6691 1507.00 22.52
Sandra SSE2 8165 6681 1484.00 22.21
SuperPi 36.531 37.828 -1.30 -3.43
3DMark01 25230 24139 1091.00 4.52
3DMark03 13356 13240 116.00 0.88
3DMark05 6049 6065 -16.00 -0.26
3DMark06 3297 3302 -5.00 -0.15
WinRar 1168 1055 113.00 10.71
7Zip 2910 2730 180.00 6.59
Photoshop 199.0 201.7 -2.70 -1.34
fr-025 50857 49763 1094.00 2.20
Quake 59.7 59.7 0.00 0.00
F.E.A.R. 23/47/90 23/48/89
Halflife 81.41 80.21 1.20 1.50
Cinebench 655 652 3.00 0.46
ScienceMark 1357.30 1298.31 58.99 4.54

Результат более чем убедителен. Даже с Command Rate=2Т быстрая шина выигрывает у низких таймингов. Это Вам не шутки - почти полторы секунды в SuperPi, 5% в 3DMark01, 11 и 6% в WinRar и 7Zip, соответственно. Игры упорно не желают сдаваться цепляясь за недостаточную производительность видеоподсистемы.
Разумеется, возможна ситуация, когда память не сможет работать на такой высокой частоте и ее придется замедлять. Может быть тогда тайминги покажут свою мощь во всей красе? Сравним 4-5-4-7-11-2Т на 398 Мгц и 3-4-3-5-11-1Т на частоте 298 Мгц.
4-5-4-7-11-2Т
398 Мгц
3-4-3-5-11-1Т
298 Мгц
разница процент
прироста
AIDA read 6108 6033 75,00 1,24
AIDA write 2341 2005 336,00 16,76
Sandra Int 7696 6691 1005,00 15,02
Sandra SSE2 7672 6681 991,00 14,83
SuperPi 37,125 37,828 -0,70 -1,86
3DMark01 22955 24139 -1184,00 -4,90
3DMark03 13319 13240 79,00 0,60
3DMark05 6050 6065 -15,00 -0,25
3DMark06 3295 3302 -7,00 -0,21
WinRar 1108 1055 53,00 5,02
7Zip 2798 2730 68,00 2,49
Photoshop 199,8 201,7 -1,90 -0,94
fr-025 50295 49763 532,00 1,07
Quake 59,7 59,7 0,00 0,00
F.E.A.R. 23/48/90 23/48/90
Halflife 80,66 80,21 0,45 0,56
Cinebench 654 652 2,00 0,31
ScienceMark 1333,26 1298,31 34,95 2,69

Увы, даже при такой форе и с включенным 1Т, тайминги опять проигрывают, практически по всем позициям. Тайминголюбивый 3DMark01, разумеется, показал худший результат при высоких таймингах, равно как и, в определенной степени, 3DMark05 и 3DMark06. Однако, в реальных приложениях продолжает править бал высокая частота.
Таким образом, можно сделать следующий вывод - в условиях, когда скорость памяти жестко привязана к стандартным частотам (400/533/667/800), лучшая производительность на платформе AMD достигается от увеличения частоты, а не таймингов просто потому, что переход от одного набора таймингов к следующему дает меньший прирост производительности нежели увеличение частоты памяти шагом в 133Мгц. Можно попытаться возразить - мол память получше, могла бы и тайминги держать пониже, а не так как в нашем тестировании, когда на каждый шаг частоты приходилось повышать основные тайминги на единичку:
478 - 5-6-5-8-12
398 - 4-5-4-7-11
298 - 3-4-3-5-11
Возможно. Однако, тогда должен был бы вырасти и частотный потенциал! Другое дело, что его не всегда удается реализовать. Возможно и другое - подача более высокого напряжения на модули памяти могла бы позволить им работать с еще более агрессивными таймингами, что могло бы сократить разрыв в производительности. Несомненно. Так же несомненно, как и то, что, в некоторых случаях, от повышенного напряжения выше погналась бы и и память. Однако не стоит забывать, что порой увеличить частоту памяти значительно проще чем понизить тайминги, если это вообще получится. Поэтому, говоря о таймингах, можно лишь говорить, что для процессоров фирмы AMD они играют большую роль чем для процессоров Intel, и это уже совсем другой разговор...
Данная статья была подготовлена в рамках выступления команды overclockers.com.UA на Битве Титанов-3, проект "Таємна Зброя".
Обсудить статью можно здесь