Изучение влияния частоты и таймингов памяти на примере платформы LGA1156

2 августа 2010, понедельник 11:10
=DEAD= для раздела Лаборатория

Оглавление

Вступление

При сборке нового компьютера (или апгрейде старого) часто задаются вопросом выбора “правильного” комплекта памяти для работы в высокопроизводительной системе. Как правило, "продвинутые" юзеры сразу начинают советовать выбрать комплект с частотой побольше и таймингами поменьше – ведь только так, по их мнению, потенциал системы раскроется полностью, да и при разгоне по шине запас прочности DRAM не помешает. Причиной таких советов, как показывает практика, становится незнание вопроса. Ведь в дальнейшем (спустя недели-месяцы) оказывается, что добавленные 3000-6000 рублей на покупку “крутой” памяти можно было потратить на покупку более производительной видеокарты или оставить на пиво или ….. (впишите сами). Первый вариант уж точно бы вылился в большую производительность системы, а второй - в утоление жажды в столь жаркую погоду.

Каждый новый обзор оперативной памяти, выходящий на нашем сайте, порождает очередной вал вопросов наших читателей. В первую очередь их интересует прирост производительности, ожидаемый от памяти с высокими частотами и низкими таймингами. Кроме того, возникают вопросы о том, что же лучше: высокая частота либо низкие тайминги, в случае, когда совместить оба варианта не представляется возможным. Многие из них, вероятно, надеются увидеть прирост в десятки процентов (хотя бы в некоторых приложениях) при переходе с 1333 МГц к 2000 МГц, да ещё и на пониженных таймингах. Другая же часть читателей не видит смысла в дорогой памяти и продолжает “сидеть” на бюджетных комплектах. Есть еще две категории, заслуживающие внимания, - профессиональные бенчеры и любители “покруче”, которые знают всю правду, впрочем, у каждого из них она своя.

К сожалению, на просторы интернета материалы по изучению вопроса влияния частоты памяти и таймингов на производительность системы выходят крайне редко. Многие ресурсы практически не уделяют внимание оперативной памяти, а в своих единичных обзорах расхваливают способности того или иного комплекта и практически всегда беспочвенно рекомендуют протестированное к покупке пользователям. Особенно этим “блистают” зарубежные издания.

Сегодня, как вы уже, наверное, догадались, вас ждут ответы на часто задаваемые вопросы, как в обсуждениях статей по памяти, так и в тематических форумах. Для кого-то они станут откровением, а для кого-то подтверждением старой доброй истины. Тестовая конфигурация

Для тестирования был использован открытый стенд со следующей конфигурацией:

  • Процессор - Intel Core i7-860 (Lynnfield);
  • Система охлаждения – Cooler Master Hyper 212 Plus;
  • Термопаста - Arctic Silver 5;
  • Материнская плата - MSI P55-GD80, Intel P55, BIOS 1.7;
  • Память – Kingston HyperX KHX2000C8D3T1K2/4GX, 2x2048 Мбайт DDR3-2000 МГц;
  • Дополнительный вентилятор - Scythe Kama-Flex 1600 RPM;
  • Видеокарта – NVIDIA GeForce 8800GTS 512 Мбайт GDDR3 PCI-E;
  • Жёсткий диск - Seagate ST3500418AS 7200.12, 500 Гб;
  • Блок питания - Cooler Master RS-A00-ESBA 1000 Вт.

Используемое программное обеспечение

Для замеров производительности использовалось разнообразное программное обеспечение:

  • Lavalys Everest 5.50.2100 - использовался встроенный тест памяти. Учитывались результаты Memory Read\Write\Copy\Latency;
  • MaxMEM2I 1.53 Multi - оценка скорости при работе с памятью в несколько потоков (Гбайт/c);
  • Fritz Chess Benchmark – учитывалось количество операций в секунду (kilo Nods);
  • SuperPi Mod 1.5 XS – однопоточный тест для вычисления числа Пи. Учитывалось время для вычисления 1M и 8M;
  • wPrime 2.03 - многопоточный тест на вычисление числа Пи. Учитывалось время для вычисления 32M;
  • WinRAR 3.93 – учитывался рейтинг встроенного теста производительности (Кбайт/c). В настройках программы был активирован режим многопоточности;
  • x264 Benchmark HD 3.18 – преобразование стандартного видеоролика формата mpg в разрешении 720p. Учитывалось среднее время по четырем результатам (в каждом по два прохода кодирования видео потока);
  • Cinebench R10 (x64) - рендеринг стандартной сцены, учитывался рейтинг процессора при однопотоковом (1 CPU) и многопотоковом рендеринге (x CPU);
  • Cinebench R11.5 (x64) – рендеринг стандартной сцены, учитывался общий рейтинг процессора;
  • Adobe Photoshop CS4 – тестирование заключалось в замере времени прохождения всех Actions из пакета тестирования DriveHeaven (итого - 15 действий);
  • 3DMark 2003 – стандартные настройки. Учитывались результаты: Overall Score, CPU Score;
  • 3DMark 2006 – стандартные настройки. Учитывались результаты: Overall Score, CPU Score;
  • Far Cry 2 – встроенный бенчмарк, Ranch Small (3 прохода), средний FPS. Тестирование проводилось в двух режимах:
    • установки – DX9, Medium, AA0x, разрешение - 1440x900;
    • установки – DX10, Ultra, AA4x, разрешение - 1920x1200;
  • Colin McRae Dirt 2 – встроенный бенчмарк, средний FPS. Тестирование проводилось в двух режимах:
    • установки – Medium, AA0x, разрешение - 1440x900;
    • установки - Ultra, AA4x, разрешение - 1920x1200;
  • S.T.A.L.K.E.R.: Call of Pripyat Benchmark – свободно распространяемый бенчмарк, средний FPS. Тестирование проводилось в двух режимах:
    • установки – Medium, AA0x, разрешение - 1440x900;
    • установки - Ultra, AA4x, разрешение - 1920x1200;
  • GTA 4 – встроенный бенчмарк, средний FPS. Тестирование проводилось в двух режимах:
    • установки - Auto Configure, разрешение - 1440x900;
    • установки - Auto Configure, разрешение - 1920x1200;

Все тесты проводились в Windows 7 64-bit. Методика тестирования

Для сегодняшнего тестирования была выбрана платформа Intel LGA 1156, как одна из самых современных и производительных в своём классе. Одним из важнейших плюсов такого выбора является встроенный контроллер RAM и возможность лёгкого достижения частот ~2000 МГц и выше, при использовании соответствующей памяти.

Для исключения влияния частот CPU, BCLK, UnCore, QPI на результаты тестов и имитации высокопроизводительного ПК параметры системы приняли следующие значения.

На протяжении всего тестирования частота процессора оставалась равной 3500 МГц (167x21), блок UnCore и шина QPI так же были “заблокированы”.

Для изучения влияния оперативной памяти на производительность ПК использовались самые популярные сочетания частота\тайминги, как из области применения простыми\продвинутыми пользователями, так и бенчерами-профессионалами:

  • 1000 МГц
    • 5-5-5-15-70
  • 1333 МГц
    • 6-6-6-18-88
    • 7-7-7-20-88
    • 8-8-8-24-98
    • 9-9-9-27-98
  • 1667 МГц
    • 6-6-6-18-88
    • 7-7-7-20-88
    • 8-8-8-24-98
    • 9-9-9-27-98
  • 2000 МГц
    • 7-7-7-20-88
    • 7-7-7-20-88 B2B-6
    • 8-8-8-24-98
    • 9-9-9-27-98
    • 10-10-10-30-120

Использовать столь разнообразные сочетания мне позволила память Kingston HyperX KHX2000C8D3T1K2/4GX, которая была проверена на разгонный потенциал в прошлой статье. Изменение частоты памяти происходило за счёт изменения множителя DRAM. Использовались значения от 3 до 6х. Напряжение изменялось в пределах 1.55-1.95 В.

Для всех сочетаний частота\тайминги каждый тест прогонялся по 3 раза, впоследствии находилось среднее арифметическое значение, которое и попадало на график.

Как вы можете заметить, в списке используемых сочетаний есть вариант, в котором задержка B2B CAS Delay принимала значение 6. Этот вариант демонстрирует ситуацию, описанную в статье по Kingston HyperX, когда при переходе планки в ~1950 МГц система вела себя нестабильно. Для обеспечения беспрерывной работы на больших частотах приходилось повышать вышеуказанный тайминг. Результаты тестирования покажут, насколько сильно это повлияло на производительность.

Результаты тестирования

Для “затравки” я использовал самый популярный бенчмарк подсистемы памяти Lavalys Everest.

Lavalys Everest


Memory Read
Мбайт/c

На тесте чтения прослеживается чёткая зависимость результатов от частоты и таймингов. Залог успеха прост: больше частота, агрессивнее задержки.

Lavalys Everest


Memory Write
Мбайт/c

Результаты скорости записи получились неожиданными. Сплошные погрешности. Как таковой зависимости нет. По всей видимости, используемая версия Everest не корректно замеряет интересующую нас величину.

Lavalys Everest


Memory Copy
Мбайт/c

Подтест Memory Copy при каждом запуске выдавал далёкие друг от друга значения (большая погрешность). На графиках можно наблюдать некоторые результаты, которые не поддаются какой-либо зависимости. А в целом совет всё тот же: больше частота, ниже тайминги.

Lavalys Everest


Memory Latency
нс

Полученные результаты Memory Latency ничего нового не продемонстрировали. Они указывают на прямую зависимость, о которой я дважды сказал выше.

MaxMEM2It


Multi-Threaded Bandwidth
Гбайт/c

Бенчмарк MaxMEM2 выводит результат на основе нескольких собственных тестов. В данном случае результатом является пропускная способность при работе с несколькими задачами одновременно. Полученные значения всё так же сильно зависят от частоты и таймингов памяти. Прирост при переходе от 1000-1333 МГц к 2000 МГц очень серьёзный. Дополнительно, что здесь можно отметить – это резкое падение результата при использовании тайминга B2B.

Fritz Chess Benchmark


x CPU
Knodes/s

“Шахматные вычисления” не показали особого прироста при увеличении частоты и уменьшении таймингов памяти. Максимальная разница в результатах меньше 1%.

Super Pi 1.5 XS


1M
сек

Во всем известном SuperPi, в дисциплине 1M, полученные значения, по моему мнению, одна сплошная погрешность. В каждом из трёх запусков результаты очень сильно различались.

Super Pi 1.5 XS


8M
сек

Куда более показательным оказался замер 8M. Прослеживается уже известная нам зависимость (а куда уж без неё, ведь это синтетическое приложение). Из интересного – нелюбовь к высоким таймингам 10-10-10-30.

wPrime 2.03t


32M
сек

Многопоточный wPrime последней версии использовался в режиме замера с точностью 32M. Погрешность в каждом из трёх запусков была большая, поэтому некоторые из результатов не сильно вписываются в общую картину.

WinRAR 3.93


Benchmark
Кбайт/c

Вот мы потихоньку переходим к более “реальным” приложениям, которые каждый из нас использует в повседневной жизни при работе с ПК. Первым в этом списке числится архиватор WinRAR и его встроенный тест производительности.

Зависимость результатов от частоты\таймингов проявляет себя в полной мере. Повторяемость результатов высока. Самым неожиданным на этом этапе стал максимальный результат, полученный при включённом B2B CAS Delay – 6. Хотя по здравой логике – такого быть не должно.

x264 Benchmark HD 3.18


Encoding
сек

При работе с тестовым пакетом x264 Benchmark HD происходило преобразование стандартного видеоролика формата mpg в разрешении 720p. Учитывалось среднее время по 4 результатам (в каждом по два прохода кодирования видео потока). Несмотря на это, повторяемость результатов оказалась не столь высокая. Поэтому “проскакивает” несколько не вписывающихся результатов.

Cinebench R10


1 CPU
Score



x CPU
Score

Для имитации работы с 3D графикой использовались пакеты Cinebench R10 и R11.5. В первом случае использовалось два режима: однопоточный и многопоточный. И в том и в другом наблюдалась относительно большая погрешность при каждом замере. Впрочем, уже знакомая зависимость от частоты\таймингов всё равно проявляется.

Cinebench R11.5


x CPU
Score

За счёт малой точности подсчёта результатов в версии R11.5 многие результаты на одних частотах схожи.

Adobe Photoshop CS4 (x64)


DriveHeaven Actions
сек

При тестировании в излюбленном инструменте большинства фотографов и дизайнеров Photoshop использовались Actions из пака DriveHeaven, в общем количестве пятнадцати штук. Результаты представлены как сумма времени выполнения всех действий.

На некоторых форумах мне приходилось читать “байки” о заметном приросте производительности Photoshop при увеличении частоты памяти и снижения таймингов. Знайте – это не так! Если взять самые часто используемые режимы работы DRAM, то одна-полторы секунды на выполнение пятнадцати действий явно не будут заметны на глаз. Да и повторяемость результатов, как вы можете заметить по графику – невелика.

3DMark 2003


Standard Settings
CPU | Overall Score

3DMark 2006


Standard Settings
CPU | Overall Score

Результаты, полученные в двух тестовых пакетах (измерители количества “попугаев”) компании Futuremark, показывают нам практически отсутствие какой-либо закономерности. Если замеры производительности CPU ещё поддаются здравой логике, то Overall Score, к сожалению, хаотичная величина.

Far Cry 2


Dx9, Med, AA0x
Avg FPS

1440 x 900 Dx10, Ultra, AA4x
Avg FPS

1920 x 1200

Подошла очередь игр. Первой в списке числится Far Cry 2 в двух режимах. Особой разницы (которая бы бросалась в глаза) не наблюдается. Прослеживается положительный отклик при работе с “агрессивными” задержками. Впрочем, разброс полученных в ходе трехкратного прогона (и на любом из сочетаний) результатов наблюдался в диапазоне от минимального до максимального значений из графиков выше.

Colin McRae Dirt 2


Med, AA0x
Avg FPS

1440 x 900

Ultra, AA4x
Avg FPS
1920 x 1200

В раллийной аркаде Colin McRae Dirt 2 все полученные данные – одна сплошная погрешность. Комментировать здесь больше нечего.

S.T.A.L.K.E.R.: Call of Pripyat


DX10, Med, AA0x
Avg FPS

1440 x 900

DX10, Ultra, AA4x
Avg FPS
1920 x 1200

В S.T.A.L.K.E.R.: Call of Pripyat ситуация чем-то напоминает предыдущие графики. В разрешении 1440x900 (аналог 1280x1024) проглядывается разница, которую внесла, в основном, возросшая частота. В большем разрешении, увы, мощности видеокарты 8800 GTS 512 Мб не хватило. Однако, есть предположение, что при большем FPS разница между режимами работы памяти была бы той же – минимальной.

GTA 4


Auto Setting
Avg FPS

1440 x 900

Auto Setting
Avg FPS
1920 x 1200

Последней игрой в нашем тестирования стала популярная GTA 4. Несмотря на достаточное количество кадров, разница результатов на двух графиках около одного кадра. Погрешность, сплошная погрешность.

Заключение

Тестирование проведено, результаты известны, можно делать выводы. А они для любителей “крутой” памяти неутешительные. Основная суть состоит в том, что реальная производительность системы на базе платформы LGA 1156 очень слабо зависит от установленной оперативной памяти. По моему мнению, подобный вывод можно отнести и к системам на базе LGA 1366, которые, несмотря на трёхканальный режим работы RAM, по своей архитектуре напоминают младшего “брата”.

Если рассматривать синтетические тесты, то прирост, естественно, заметен. Результаты увеличиваются пропорционально повышению частоты планок и понижению их таймингов. В случае же с приложениями, более приближенными к реалиям нашей жизни (при стандартной работе за ПК), прирост производительности практически отсутствует. Не увидите вы его, как при повышении частоты памяти с одного гигагерца до двух, так и при снижении задержек с 10-10-10-30 до 5-5-5-15. Уверять же себя в том, что скорость работы системы возросла лишь на основе результатов синтетических тестов – дело, по крайней мере, глупое.

Если продолжать разговор о производительности ПК, то лучшим вариантов траты денег станет покупка более мощной видеокарты, процессора другого класса или приобретение дополнительных планок. А так, вкладывая деньги в дорогую оперативную память, вы порадуетесь красивым радиаторам, похвастаетесь перед знакомыми и друзьями (и такие случаи бывают) или будете уверять себя в том, что сделали такую покупку не зря. По праву оценить такую покупку смогут лишь очень увлечённые оверклокеры и бенчеры. Они же – любители циферок побольше.

Одним из вопросов, которые я задавал себе перед тестированием, был - “Как сильно влияет включение задержки B2B CAS Delay на производительность системы?”. Результаты, полученные в ходе тестирования, показали понижение производительности в среднем на 1-2%, по сравнению с режимом, где B2B остаётся в положении Disable. Подобное отставание (если оно кого-то очень волнует) можно нивелировать через повышение тактовой частоты RAM на 10-20 МГц. Есть же приложения, где разница в результатах находится в пределах погрешности, то есть попросту отсутствует.

На часто задаваемый вопрос о выборе между высокой частотой и низкими таймингами, можно ответить так – выставляйте те значения, на которых ваша оперативная память способна стабильно работать. Как вы уже поняли, исходя из полученных результатов тестирования, “насиловать” DRAM за счёт повышения нагрузки на неё нет никакого смысла. Если же, дорогой мой читатель, ты используешь высокоскоростную память для собственного утешения либо бенчмаркинга, то я надеюсь, ты и без меня знаешь всю правду.

Грыжин Александр aka =DEAD=

Теги