Из спичек и желудей — поможет ли Phenom'у быстрая память
реклама
Введение
В процессе подготовки обещанного материала по разгону и тестированию Phenom II X4/X6 на материнской плате Socket AM3 встал вопрос, с какой памятью тестировать процессоры на указанной платформе — де-юре поддерживаемой указанной платформой DDR3-1333 или более высокочастотной DDR3-1600, поддерживаемой де-факто в большинстве случаев. Да и в комментариях к предыдущей статье было справедливо отмечено, что использованная в тестах на Socket AM2+ плате DDR2-800 память с первичными таймингами 6-6-6, мягко скажем, не предел мечтаний. Так что было решено посмотреть, что даст процессорам микроархитектуры K10 более быстрая память, причём как на Socket AM2+, так и на Socket AM3. И начнём мы с ответа на вопрос: а откуда вообще есть уверенность, что быстрая память хоть как-то поднимет производительность тестируемых компьютерных систем? Ведь если это не так, то и смысла в задуманном тестировании исчезающе мало.
Что ж, надеюсь, что для большинства читателей этого ресурса не станет откровением упомянутый ещё в прошлой статье следующий общеизвестный факт — производительность большинства современных компьютерных систем в большинстве задач ограничена не столько скоростью счёта процессора, сколько латентностью и пропускной способностью памяти. Именно по этой причине, например, простое увеличение тактовой частоты процессора поднятием множителя без увеличения пропускной способности памяти и уменьшения её латентности — априори не самый эффективный способ разгона. И по этой же причине быстрая память всегда увеличивает производительность хоть сколь-нибудь современных компьютерных систем даже при использовании процессора на стоковых частотах. Вопрос лишь в том, насколько вырастет производительность в конкретном сценарии использования и будет ли, как следствие, покупка более быстрой памяти или её разгон целесообразны.
реклама
А почему вообще имеет место вышеупомянутая ситуация с ограничением производительности скоростью работы оперативной памяти? Короткий ответ — так сложилось исторически. Дело в том, что начиная примерно с 1980 года скорость выполнения процессорами инструкций росла значительно опережающими темпами по сравнению со скоростными характеристиками наиболее массовой DRAM-памяти. Вот так, например, выглядит динамика изменения производительности одного процессорного ядра по сравнению с динамикой производительности DRAM-памяти за последние десятилетия. График взят из известной книги по архитектуре компьютерных систем Computer Architecture: A Quantitative Approach (авторы John L. Hennessy и David A. Patterson).
Линия производительности процессора на графике отражает рост количества запросов на доступ к памяти в секунду, а линия производительности памяти — рост количества операций доступа к памяти в секунду, которые DRAM-память способна обслужить (величину, обратную латентности памяти). Да, время доступа к памяти год от года улучшается, но темпов этого улучшения уже давно недостаточно чтобы соответствовать темпам роста производительности процессоров. Для понимания масштабов проблемы обратите внимание на тот факт, что вертикальная ось имеет логарифмический масштаб. Так что даже переход индустрии на многоядерные процессоры, сопровождающийся серьёзным замедлением темпов роста производительности отдельного процессорного ядра, не вселяет никакого оптимизма. К тому же, не стоит забывать, что помимо латентности имеет значение и пропускная способность памяти, и в этом отношении с одной стороны ситуация обстоит несколько лучше, так как разрыва на несколько порядков между желаниями процессора и способностями DRAM-памяти здесь уже нет, но с другой у многоядерных процессоров требования к пропускной способности выше и с ростом среднего числа ядер они лишь продолжают год от года расти. Так, например, в вышеупомянутой книге приводится пример Intel Core i7-6700, пиковые теоретические потребности которого в пропускной способности памяти составляют внушительные 409.6 ГБ/с, что аж в 8 раз превышает пропускную способность DDR4-3200 памяти в двухканальном режиме (2×25.6 ГБ/с). Разрыв, конечно, не такой катастрофический как в случае с латентностью, но ведь сейчас в 2020 даже в настольных системах с двумя каналами памяти и 8 ядрами уже никого не удивишь, а пропускная способность DRAM-памяти практически не изменилась.
реклама
Безусловно уже многие десятилетия и отчасти успешно инженеры пытаются обойти обсуждаемое “узкое место” компьютерных систем путём совершенствования иерархии процессорных кэшей и других многочисленных усовершенствований архитектуры, однако, это сильно усложняет архитектуру современных процессоров, что приводит не только к их удорожанию, но и к высокому риску наличия уязвимостей (вспоминаем пресловутые Spectre, Meltdown и иже с ними). Впрочем, сегодня разговор не о микроархитектурных уязвимостях, а о быстрой памяти, так что не будем отвлекаться, а перейдём к результатам синтетических и игровых тестов.
Методика тестирования
Для тестов был выбран единственный участник предыдущего "забега" (Phenom II X4 925) так как ни времени, ни особого желания тестировать несколько процессоров одной микроархитектуры во всём множестве вариантов не было. Помимо уже имеющихся данных о производительности выбранного процессора с DDR2-800 CL6 памятью, были дополнительно протестированы варианты с DDR2-1066 CL5, DDR3-1333 CL9 и DDR3-1600 CL9 памятью. Тестовый стенд в случае использования DDR2-памяти тот же, что и ранее, а основой тестового стенда с DDR3-памятью стала материнская плата ASUS M4A79T Deluxe.
Напомню, что комплект из двух 4 ГБ плашек DDR2-800 CL6 представляет собой классическую дешёвую "AMD-only" DDR2-память с Aliexpress, использующую особенность контроллера памяти K10 и, как следствие, корректно работающую только с процессорами AMD. Первичные тайминги tCL-tRCD-tRP памяти "всемирно известного" бренда Atermiter равны 6-6-6, что есть худший вариант для DDR2-800 памяти согласно спецификации JEDEC. Да и скорость передачи данных в 800 MT/s для DDR2-памяти не предел — JEDEC был определён ещё стандарт DDR2-1066, который процессоры микроархитектуры K10 поддерживают, правда, с оговорками. А именно, в описании ко многим материнским платам, у которых заявлена поддержка DDR2-1066 памяти, имеется предупреждение о том, что такая память поддерживается только в режиме одна планка на канал (Note: Due to AMD AM3/ AM2+ CPU limitation, memory module of DDR2 1066 or above speed is only supported by 1 dimm per channel). На практике у меня проблем с двумя планками на канал не возникло, но отметить этот момент стоило. Итак, наша "скоростная" DDR2-1066 CL5 память представлена четырьмя 2 ГБ модулями Kingston KHX8500D2/2G с первичными таймингами 5-5-5 — не предел мечтаний, конечно, но на фоне DDR2-800 (6-6-6) смотрятся неплохо: прирост по теоретической пропускной способности составляет 33.3%, а латентность ниже на 37.5%.
реклама
DDR3-1333 CL9 представлена двумя 4 ГБ DDR3-1866 планками от ещё одного именитого китайского бренда Kllisre. На деле в использованных в тестировании экземплярах планок стоят чипы SEC K4B2G0846D-HYK0, номинальным режимом работы которых является DDR3-1600 (11-11-11), но поддерживаются ещё и режимы DDR3-1333 (9-9-9) и DDR3-1066 (7-7-7). Собственно, второй из этих режимов и обозначен в результатах как DDR3-1333 CL9. Так же как и в случае c DDR2-800 набор первичных таймингов 9-9-9 для DDR3-1333 отнюдь не предел мечтаний — в спецификации JEDEC хуже для DDR3-1333 памяти только вариант 10-10-10. DDR3-1600 CL9 — те же планки, только с "ужатыми" до 9-9-9 первичными таймингами. По сравнению с тестируемыми вариантами DDR2, преимущества более скоростной DDR3-памяти над её менее скоростным вариантом, конечно, не столь значительны (всего 20% по пропускной способности и 16.7% по латентности), но что есть. От покупки более скоростной DDR3-памяти было решено пока отказаться, так как тут имеется, как минимум, один нюанс — есть желание использовать одну и туже DDR3-память в тестах платформы Socket AM3 и пока ещё только планируемых замерах производительности на LGA775, а последняя платформа поддерживает лишь DDR3-память с чипами (относительно) невысокой плотности. Так, например, на LGA775 4 ГБ планки с 8 чипами по 512 МБ с одной стороны работать не будут, а двусторонние 4 ГБ планки с 16 чипами по 256 МБ "поедут" без проблем. Вот только среди таких планок вариантов DDR3-1600 с таймингами ниже 9-9-9 особо и нет, поэтому решено было остановится на том, что уже есть в наличии, благо имеющиеся планки 4 ГБ планки Kllisre двусторонние и работают на LGA775.
Система с Intel Pentium G4600, как и ранее, оснащена двумя 4 ГБ модулями DDR4-2400 (18-17-17).
AIDA64
реклама
При сравнении результатов тестов пропускной способности памяти сразу бросается в глаза, что скорости чтения закономерно возрастают примерно на треть при переходе от DDR2-800 к DDR2-1066 (33% прирост в частоте), а вот скорости записи остаются равными. Схожую картину можно увидеть в тестах Phenom прошлых лет, по всей видимости причиной является наличие в контроллере памяти некого ограничение на скорость записи в память, так как при разгоне процессора с повышением частоты контроллера памяти с 2.0 до 2.6 ГГц скорость записи увеличивается, но по-прежнему никак не откликается на повышение частоты модулей памяти. Ограничение в контроллере памяти имеется и на скорость чтения, только достигается оно, как видно из диаграммы результатов, уже на более высоких частотах работы оперативной памяти. Так, например, скорость чтения из DDR3-1600 выше всего на 8% по сравнению с DDR2-1066 при 50% преимуществе в частоте, а при разгоне процессора с повышением частоты контроллера памяти разрыв между вышеупомянутыми комплектами возрастает уже до 32%.
Результаты тестов CPU и FPU в общем и целом тривиальны, но "для галочки" всё же приведены. Как уже упоминалось ранее, хороший синтетический бенчмарк должен в идеале тестировать производительность единственного узла компьютерной системы без упора в остальные его части. В этом, собственно, и заключается как преимущество любого хорошего синтетического теста производительности, так и его недостаток. И надо сказать, в этом отношении синтетические тесты CPU и FPU в AIDA64 хороши за одним единственным исключением — все бенчмарки, кроме CPU PhotoWorxx, никак не отреагировали на улучшение скоростных характеристик подсистемы памяти, и именно так и должны вести себя синтетические тесты скорости выполнения инструкций различными исполнительными устройствами центрального процессора. Девиантное поведение PhotoWorxx, впрочем, сюрпризом не стало, ибо практически любой, кто занимался разгоном оперативной памяти о таком поведении этого бенчмарка в курсе. Другой вопрос — место ли PhotoWorxx в тестах производительности CPU, но это уже не ко мне.
Результаты игровых тестов
Grand Theft Auto V (2015, RAGE, DX11)
Batman: Arkham Knight (2015, Unreal Engine 3, DX11)
Deus Ex: Mankind Divided (2016, Dawn Engine, DX11 и DX12)
Sid Meier's Civilization VI (2016, Собственный, DX11 и DX12)
Tom Clancy's Ghost Recon Wildlands (2017, AnvilNext 2.0, DX11)
Warhammer 40,000: Dawn of War III (2017, Essence Engine 4, DX11)
Total War: Warhammer II (2017, TW Engine 3, DX11 и DX12)
Middle-earth: Shadow of War (2017, Firebird Engine, DX11)
F1 2018 (2018, EGO Engine, DX11 и DX12)
Strange Brigade (2018, Asura Engine, DX12 и Vulkan)
Shadow of the Tomb Raider (2018, Foundation Engine, DX11 и DX12)
Forza Horizon 4 (2018, ForzaTech, DX12)
Hitman 2 (2018, Glacier 2, DX11 и DX12)
Far Cry New Dawn (2019, Dunia 2, DX11)
Metro Exodus (2019, 4A Engine, DX11 и DX12)
Gears 5 (2019, Unreal Engine 4, DX12)
Borderlands 3 (2019, Unreal Engine 4, DX11 и DX12)
Обсуждение результатов
В этот раз было решено отказаться от обсуждения результатов в каждой из протестированных игр в отдельности (так как они очень схожи), а сразу перейти к обсуждению средней производительности по всем протестированным игровым проектам. Итак, что же мы видим?
- В стоке Phenom II X4 925 в паре с DDR2-1066 CL5 памятью обходит себя же в паре с DDR2-800 CL6 памятью на 24%, 23% и 28% по показателям среднего, 1% и 0.1% низких FPS. Сами по себе эти результаты, возможно, не впечатляют, но обратите внимание, что разгон Phenom II X4 925 до 3.6 ГГц с DDR2-800 CL6 памятью без значимого подъёма частоты последней увеличил производительность на 27%, 28% и 40% по тем же показателям. То есть банальное использование быстрой DDR2-памяти с процессором на стоковой частоте дало практически такой же прирост производительности, как и разгон процессора с 2.8 до 3.6 ГГц при использовании медленной DDR2-памяти. В среднем вариант с разгоном процессора в паре DDR2-800 CL6 памятью быстрее варианта без разгона с DDR2-1066 CL5 памятью лишь на 3%, 5% и 12% по указанным показателям.
- Разгон Phenom II X4 925 с DDR2-800 CL6 памятью поднимает игровую производительность на 27%, 28% и 40% по показателям среднего, 1% и 0.1% низких FPS. Прирост от разгона процессора с DDR2-1066 CL5 памятью несколько скромнее — 20%, 22% и 33% по тем же показателям. В обоих случая частоты процессора и контроллера памяти были увеличена с 2.8 до 3.6 ГГц и с 2.0 до 2.6 ГГц, соответственно, а частота памяти практически не поменялась. Если сравнивать оба варианта разгона между собой, то в разгоне более быстрая DDR2-память даёт дополнительные 16%, 17% и 21% игровой производительности, то есть чуть меньше, чем на стоковых частотах.
- Результаты с DDR3-1333 CL9 памятью практически идентичны таковым с DDR2-1066 CL5 и в стоке, и в разгоне, а использование чуть более быстрой DDR3-1600 CL9 памяти даёт дополнительные 4%, 4% и 7% по показателям среднего, 1% и 0.1% низких FPS в стоке и 8%, 8% и 9% в разгоне. От более быстрой, например, DDR3-1600 CL7 памяти можно ожидать ещё большего прироста.
- Как уже было показано ранее, в стоке c медленной DDR2-памятью Phenom II X4 925 отстаёт по игровой по производительности от Pentium G4600 на внушительные 50% по показателям среднего, 1% и 0.1% низких FPS, разгон практически без поднятия частоты памяти сокращает отставание до 35% по всем показателям. Результаты нынешнего исследования показывают, что использование быстрой DDR2 или DDR3-памяти в купе с разгоном сокращают отставание от "гиперпня" уже до незначительных 18%.
Выводы
- Быстрая DDR2-память способна существенно поднять игровую производительность Phenom II X4 и в стоке, и в разгоне. Понятно, что если Вы каким-то чудом "застряли" на Socket AM2+, то сейчас в 2020 смысла гоняться за быстрой DDR2-1066 памятью ради дополнительных 20% игровой производительности исчезающие мало. Но надо отметить, что многие оригинальные 1-2 ГБ DDR2-800 планки могут взять частоты около 1000, пуская и не с самыми завидными таймингами. С китайскими 4 ГБ планками "всё сложно": заявленные 800 бы брали и был бы "уже хлеб".
- "Быстрая" DDR2-память не уступает "медленной" DDR3-памяти, а от использования "быстрой" DDR3-памяти на Socket AM3 толку, по всей видимости, уже не так много. Конечно, DDR3-1600 CL9, как уже было упомянуто, не предел мечтаний, зато такой памяти на вторичном рынке навалом и стоит она совсем недорого. К тому же никаких проблем с DDR3-1600, несмотря на отсутствие поддержки этой памяти процессорами K10, ни в стоке, ни в разгоне не было, так что волею судеб застрявшим на Socket AM3 можно рекомендовать как раз DDR3-1600. И именно с такой памятью мы и проведём сравнение 4 и 6-ядерного Phenom'ов, о результатах которого будет вскоре доложено. В конечном счёте, даже если материнская плата поддерживает лишь DDR3-1333, память DDR3-1600 заведётся и на этой частоте. Единственный нюанс, который здесь вновь надо учитывать — китайская DDR3-память обычно (так же как и DDR2) уже разогнанная, т.е. планки DDR2-1600 запросто могут быть на чипах DDR3-1333, а планки DDR2-1866 на чипах DDR2-1600 и т.п.
- Конечно, необходимо понимать, что приведённые показатели относительной производительности относятся к случаю, когда производительность не упирается в видеокарту, а иначе прирост производительности от использования более быстрой памяти может быть значительно ниже.
- В целом все протестированные игровые проекты на Phenom II X4 в разгоне с "быстрой" DDR2 и отнюдь не самой быстрой DDR3 памятью играбельны "на минималках". По крайней мере, 4-ядерный "старичок" способен выдать производительность уровня современного 2-ядерного 4-поточного "гиперпня", пускай ему для этого и необходим разгон и "быстрая" память.
На этом на сегодня всё, а в следующем материале таки наконец сравним Phenom II X4 и X6 на плате Socket AM3 с DDR3-1600 памятью.
реклама
Теги
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила