В последнем материале по тестированию центральных процессоров AMD прошлых лет в современном программном окружении, опубликованном ещё в июне, имелось сразу несколько недостатков. Так что в сегодняшней статье мы одним махом постараемся устранить все три указанных недостатка, так что можно будет оставить героев прошлых лет наконец в покое.
Как и ранее, в качестве ориентира современного используется "гиперпень". Тестовые стенды так же остались практически без изменений, за исключением видеокарты.
Процедура разгона на платформе AM3 принципиально ничем не отличалась от описанной ранее для AM2+, за исключением, естественно, результирующих частот работы модулей памяти. Процессоры AMD показали разный разгонный потенциал: Athlon II X4 630 покорил планку лишь в 240 МГц "по шине", Phenom II X4 925 — в 260 МГц, а Phenom II X6 1055T показал ещё лучше, одолев 280 МГц "по шине" и почти добравшись до заветных 4 ГГц по частоте ядер.
Множитель встроенного контроллера памяти был установлен равным 10 во всех случаях, а делитель памяти — 3:10. Отметим, что для Athlon использование делителя 3:10 приводит к тому, что итоговая частота памяти в разгоне оказалась равной стоковой, а именно, DDR3-1600 (9-9-9). И сразу скажем, что вариант с делителем памяти 1:4 и результирующей частотой памяти DDR3-1920 (10-10-10) тоже тестировался — никакой значимой разницы выбор делителя в этом случае на производительность не оказывает, так как, по всей видимости, всё упирается в скорость работы контроллера памяти. Так что для единообразия решено было оставить делитель равным 3:10 для всех процессоров. И последнее, что касается памяти — начиная примерно с DDR3-1800, для стабильной работы требуется немного поднять первичные тайминги, поэтому для 6-ядерного Phenom они несколько выше.
Начинаем, как обычно, с результатов синтетических тестов из пакета AIDA64, в которых, правда, не будет ничего нового.
Показатели представителей микроархитектуры K10 в тестах памяти не впечатляют — даже в комплексном разгоне (увеличение не только частоты процессора, но и контроллера памяти) процессоры AMD значительно отстают от G4600 со стоковой DDR4-2400 памятью. В тестах записи (и копирования) Phenom II X4 немного обходит равночастотный Athlon II X4, здесь, возможно, сказывается наличие у первого кэша L3. Результаты Phenom II X6 в тестах записи и копирования, однако, даже несколько хуже таковых у Athlon II X4, что, скорее всего, объясняется тем простым фактом, что архитектурно идентичному контроллеру памяти в 6-ядерном процессоре приходится обслуживать на 50% больше ядер.
Переходим к синтетическим тестам центрального процессора. На диаграммах, приведённых ниже, результаты оценки производительности процессоров AMD в тестах CPU и FPU вновь, как и ранее, для наглядности приведены относительно таковых для Pentium G4600, показатели которого взяты за 1.
Тесты производительности вычислительных блоков ЦП также демонстрируют уже привычную картину — в большинстве тестов 6-ядерный Phenom II X6 "в стоке" наступает "гиперпню" на пятки или даже незначительно обгоняет последнего, а в разгоне способен без труда обойти современный 2-ядерник, причём преимущество может быть более чем двукратным. В очередной раз отметим, однако, что на практике реализуется подобный сценарий только в случае, если используемое программное обеспечение хорошо масштабируется на большое количество потоков, не упирается в производительность подсистемы памяти и мало что получает от использования новых инструкций. И в отличие от синтетических бенчмарков, в реальных приложениях, и особенно в играх, такая ситуация, скорее, редкость. Аналогичное расхождение результатов в синтетических тестах и реальных задачах можно наблюдать и в отношении наличия или отсутствия кэша — в синтетических тестах кэш L3 "пригодился" лишь в PhotoWorxx, который, как уже неоднократно отмечалось, де-факто совсем несинтетический, в остальных же случаях Athlon II X4 ни в чём не уступил Phenom II X4.
Мы уже неоднократно убеждались, что в реальном программном обеспечении картина производительности зачастую совсем иная, так что давайте уже перейдём к реальному ПО, начав с игрового.
Grand Theft Auto V (2015, RAGE, DX11)
В старой-доброй GTA V существенной разницы в относительной производительности между различными вариантами графических настроек не наблюдается — на одинаковых частотах ("в стоке") Phenom II X6 немного обгоняет Phenom II X4, который, в свою очередь, так же незначительно обходит Athlon II X4. В разгоне из-за различного разгонного потенциала тестируемых экземпляров разрыв между процессорами AMD становиться больше. Касательно сравнения Phenom II X6 с "гиперпнём", видим, что в разгоне "старичку" даже удаётся обойти последний, причём на всех вариантах настроек. Разница, впрочем, находится на границе погрешности измерений. Отметьте так же, что на минимальных настройках 6-ядерный Phenom обходит 4-ядерный преимущественно по средней производительности при практически идентичной минимальной, но с ростом настроек 6-ядерник выходит вперёд и по статистике редких событий. Grand Theft Auto V вполне себе умеет эффективно использовать более 4 потоков, просто на минимальных настройках особой пользы от пары "лишних" ядер не наблюдалось. Но стоило поднять настройки и стабильность частоты кадров на 6-ядерном Phenom стала заметно лучше в сравнении с 4-ядерными коллегами. В плане играбельности стабильные 30 FPS можно получить и на "гиперпне", и на Phenom II X4/X6 даже на "ультрах", правда в разгоне, пускай и небольшом. Athlon II X4 выступил чуть хуже — но у него и кэша L3 нет, и разгон совсем невпечатляющий.
Sid Meier's Civilization VI (2016, Собственный, DX11)
В ещё одной довольно популярной DirectX 11 игре прошлых лет Phenom II X6 в разгоне уже обходит "гиперпень", пускай преимущественно и по стабильности частоты кадров. 4-ядерные Phenom II и Athlon II выступают чуть скромнее, но даже их достаточно для стабильных 30 FPS на ультра-настройках качества, причём достаточно даже "в стоке". А ещё в Civilization VI польза от 6 ядер видна уже на "минималках" и с ростом настроек качества она никуда не исчезает.
Total War: Warhammer II (2017, TW Engine 3, DX11)
Похожую на GTA V картину производительности можно видеть и в популярной стратегии Creative Assembly, по крайней мере, в режиме боя (Battle Benchmark), в котором игра неплохо масштабируется по потокам. По средним показателям "гиперпень" всё же немного впереди разогнанного Phenom II X6, но преимущество незначительно. 4-ядерные процессоры Phenom II и Athlon II вновь выступают заметно хуже независимо от уровня настроек графики. Ультра-настройки вновь можно себе позволить и на "гиперпне" и на процессорах из прошлого, последние, правда, желательно немного разогнать.
А вот в режиме кампании (Campaign Benchmark) большая часть нагрузки ложится всего лишь на один поток, так что здесь Phenom II X6 на равных частотах (в стоке) практически не отрывается от Phenom II X4, И TurboCore тут 6-ядернику не помощник, так как несмотря на преимущественно однопоточный характер нагрузку, потоков игра создаёт достаточно для того, чтобы функция TurboCore не активировалась. А вот Athlon II X4 на той же стоковой частоте чувствует себя чуть хуже из-за отсутствия L3-кэша. В разгоне Phenom II X6 отрывается от Phenom II X4, а тот, в свою очередь, от Athlon II X4 попросту за счёт более высокого разгонного потенциала протестированных экземпляров.
Middle-earth: Shadow of War (2017, Firebird Engine, DX11)
Middle-earth: Shadow of War так же подавай высокую однопоточную производительность — здесь проку от дополнительной пары ядер в Phenom II X6 в сравнении с Phenom II X4 практически нет. "Гиперпень" лидирует, но с небольшим отрывом, да и даже на ультра-настройках проблем пользователи старых процессоров AMD не испытают — даже лишённый кэша L3 Athlon II X4 в стоке способен обеспечить стабильные 40 FPS.
F1 2018 (2018, EGO Engine, DX11)
В автосимуляторе Codemasters паре дополнительных ядер нашлось применение на всех уровнях настройки графики — Phenom II X6 заметно обгоняет Phenom II X4 и по медиане, и 1-ому процентилю FPS. Наличие L3-кэша важно чуть в меньшей степени, но Athlon II X4 всё же позади Phenom II X4 даже на равных частотах. Впрочем, и высокой однопоточной производительностью игра не брезгует, так что "гиперпень" всё же впереди, да и в разгоне разрыв между процессорами AMD растёт за счёт различного разгонного потенциала. С ультра-настройками вновь никаких проблем — и "гиперпень" и Phenom в разгоне обеспечат стабильные 60 FPS.
Shadow of the Tomb Raider (2018, Foundation Engine, DX12)
Hitman 2 (2018, Glacier 2, DX12)
Настал черёд более серьёзных испытаний. Первая пара DirectX 12 игр из списка бенчмарков демонстрирует интересные, но в целом ожидаемые, результаты — современным играм, написанным под современные API, важна не только высокая однопоточная производительность, но и большое количество ядер/потоков. И в Shadow of the Tomb Raider, и в Hitman 2 "гиперпень" был наконец повержен 6-ядерным Phenom в разгоне. Причём выше оказалась не только средняя производительность, но и стабильность частоты кадров. Phenom II X6 вообще оказался единственным процессором, который смог обеспечить стабильные 30 FPS в указанных играх. 4-ядерный Phenom II до заветной отметки немного недотянул, впрочем, и на современных 2 ядрах и 4 потоках этим играм уже так же "душно".
Far Cry New Dawn (2019, Dunia 2, DX11)
Несмотря на использование "старой" версии API DirectX, игра Ubisoft демонстрирует поведение, близкое к вышеописанному у современных DirectX 12 игр. Да, прирост от пары дополнительных ядер в Phenom II ниже, да и наблюдается почти паритет 6-ядерного "старичка" в разгоне с "гиперпнём", но первый всё же впереди. Ультра-настройки в Far Cry New Dawn менее требовательный к производительности центрального процессора — стабильные 30 FPS тут смогли обеспечить почти все участники даже на стоковых частотах.
Metro Exodus (2019, 4A Engine, DX12)
В последней на данный момент части Metro, ситуация несколько нестандартная — несмотря на использование DirectX 12, от наличия двух дополнительных ядер K10 независимо от настроек графики подрастает в первую очередь именно средняя производительность, а не стабильность времени кадра. В разгоне Phenom II X6 идёт с "гиперпнём" "ноздря в ноздрю" так же на всех протестированных настройках. Ультра-настройки в этой игре дались участникам тестирования ещё с большим трудом, чем в Shadow of the Tomb Raider и Hitman 2 — до абсолютно стабильных 30 FPS недотянул никто, хотя "гиперпень" и 6-ядерный Phenom в разгоне подошли к заветной отметке максимально близко.
Borderlands 3 (2019, Unreal Engine 4, DX12)
И, наконец, в Borderlands 3 вновь наблюдаем типичную для DirectX 12 проектов картину — производительность 6-ядерного Phenom II заметно выше 4-ядерного собрата, а наличие кэша L3 менее важно. "Гиперпень" вновь повержен 6-ядерником в разгоне на всех вариантах графических настроек. Ультра-настройки для участников тестирования опять же не приговор, как минимум в разгоне.
Среднегеометрические результаты
Что ж, в этот раз игры были протестированы не только на минимальных настройках качества и в целом получилась не такая уж и плачевная картина.
Но не всё же в игры играть. Как говорится, "делу время, потехе час". Давайте посмотрим, измениться ли картина относительной производительности тестируемых процессоров при переходе к неигровым приложениям. Для этих целей были отобраны несколько наиболее интересных широкой аудитории тестов из пакета SPECworkstation 3.
Как видим, в неигровом программном обеспечении картина может быть различной — где-то масштабируемость по ядрам/потокам настолько хороша, что даже несмотря на сравнительно высокий IPC и частоты, 6-ядерный представитель микроархитектуры K10 может тягаться с современным 2-ядерным 4-поточным процессором и даже побеждать, а где-то важнее однопоточная производительность и "гиперпень" легко обходит 6-ядерного "старичка". Ну а 4-ядерные представители K10 уступают "гиперпню" почти всегда и везде.
Вот такая получается картина. На этом, пожалуй, прощаемся с платформой AM3, так как большая часть программы по исследованию её производительности выполнена. Методики тестирования плюс-минус отработана, так что теперь можно двигаться дальше.