Детальное исследование производительности 4 и 6-ядерных процессоров AMD второго поколения
реклама
Введение
В последнем материале по тестированию центральных процессоров AMD прошлых лет в современном программном окружении, опубликованном ещё в июне, имелось сразу несколько недостатков. Так что в сегодняшней статье мы одним махом постараемся устранить все три указанных недостатка, так что можно будет оставить героев прошлых лет наконец в покое.
- Во-первых, в июньском тестировании не участвовал и без того обделённый (L3-кэшем) Athlon II X4 630. Непорядок, возвращаем "кандидата от народа" в гонку.
- Во-вторых, производительность в играх тестировались лишь на минимальных настройках качества, так как имелись обоснованные сомнения в способности GeForce GTX 1060 c 6 ГБ не быть "бутылочным горлышком" на более высоких настройках даже в HD-разрешении. Здесь небольшой апгрейд до GeForce RTX 2060 Super будет как нельзя кстати. Да, сразу скажем, что местами и эта карта, даже в HD, будет ограничивать игровую производительность в наших тестах. Но, во-первых, позволить себе что-то более производительное с текущим курсом рубля без серьёзного урона семейному бюджету я уже не могу. И, во-вторых, оно, строго говоря, и не очень то нужно — использование карты, превосходящей GeForce RTX 2060 Super по производительности в HD, с тестируемыми процессорами это уж совсем нереалистичный сценарий.
- Наконец, в-третьих, остался совсем не освещённым вопрос неигровой производительности тестируемых процессоров, а не всё ведь в игры играть. Исправим и это недостаток, добавив немного тестов в профессиональном программном обеспечении, используя для этих целей тесты из пакета SPECworkstation 3.
реклама
Как и ранее, в качестве ориентира современного используется "гиперпень". Тестовые стенды так же остались практически без изменений, за исключением видеокарты.
- Основы тестовых стендов AM3 и LGA 1151 составляют материнские платы ASUS M4A79T Deluxe и MSI B250M PRO-VD, соответственно.
- Остальные комплектующие, кроме оперативной памяти, идентичны: видеокарта GeForce RTX 2060 Super от KFA2, бюджетный SSD WD Green на 240 ГБ под Windows и приложения, жёсткий диск Seagate 7200 BarraCuda на 3 ТБ под игры, блок питания Xilence Performance A+ 630 Вт.
- Первый стенд оснащён 2 планками DDR3-1600 CL9 памяти с Aliexpress объёмом по 4 ГБ каждая, о которой подробнее писалось ранее, второй — 2 планками DDR4-2400 CL17 памяти так же объёмом по 4 ГБ каждая.
Процедура разгона на платформе AM3 принципиально ничем не отличалась от описанной ранее для AM2+, за исключением, естественно, результирующих частот работы модулей памяти. Процессоры AMD показали разный разгонный потенциал: Athlon II X4 630 покорил планку лишь в 240 МГц "по шине", Phenom II X4 925 — в 260 МГц, а Phenom II X6 1055T показал ещё лучше, одолев 280 МГц "по шине" и почти добравшись до заветных 4 ГГц по частоте ядер.
реклама
Множитель встроенного контроллера памяти был установлен равным 10 во всех случаях, а делитель памяти — 3:10. Отметим, что для Athlon использование делителя 3:10 приводит к тому, что итоговая частота памяти в разгоне оказалась равной стоковой, а именно, DDR3-1600 (9-9-9). И сразу скажем, что вариант с делителем памяти 1:4 и результирующей частотой памяти DDR3-1920 (10-10-10) тоже тестировался — никакой значимой разницы выбор делителя в этом случае на производительность не оказывает, так как, по всей видимости, всё упирается в скорость работы контроллера памяти. Так что для единообразия решено было оставить делитель равным 3:10 для всех процессоров. И последнее, что касается памяти — начиная примерно с DDR3-1800, для стабильной работы требуется немного поднять первичные тайминги, поэтому для 6-ядерного Phenom они несколько выше.
AIDA64
Начинаем, как обычно, с результатов синтетических тестов из пакета AIDA64, в которых, правда, не будет ничего нового.
Показатели представителей микроархитектуры K10 в тестах памяти не впечатляют — даже в комплексном разгоне (увеличение не только частоты процессора, но и контроллера памяти) процессоры AMD значительно отстают от G4600 со стоковой DDR4-2400 памятью. В тестах записи (и копирования) Phenom II X4 немного обходит равночастотный Athlon II X4, здесь, возможно, сказывается наличие у первого кэша L3. Результаты Phenom II X6 в тестах записи и копирования, однако, даже несколько хуже таковых у Athlon II X4, что, скорее всего, объясняется тем простым фактом, что архитектурно идентичному контроллеру памяти в 6-ядерном процессоре приходится обслуживать на 50% больше ядер.
реклама
Переходим к синтетическим тестам центрального процессора. На диаграммах, приведённых ниже, результаты оценки производительности процессоров AMD в тестах CPU и FPU вновь, как и ранее, для наглядности приведены относительно таковых для Pentium G4600, показатели которого взяты за 1.
Тесты производительности вычислительных блоков ЦП также демонстрируют уже привычную картину — в большинстве тестов 6-ядерный Phenom II X6 "в стоке" наступает "гиперпню" на пятки или даже незначительно обгоняет последнего, а в разгоне способен без труда обойти современный 2-ядерник, причём преимущество может быть более чем двукратным. В очередной раз отметим, однако, что на практике реализуется подобный сценарий только в случае, если используемое программное обеспечение хорошо масштабируется на большое количество потоков, не упирается в производительность подсистемы памяти и мало что получает от использования новых инструкций. И в отличие от синтетических бенчмарков, в реальных приложениях, и особенно в играх, такая ситуация, скорее, редкость. Аналогичное расхождение результатов в синтетических тестах и реальных задачах можно наблюдать и в отношении наличия или отсутствия кэша — в синтетических тестах кэш L3 "пригодился" лишь в PhotoWorxx, который, как уже неоднократно отмечалось, де-факто совсем несинтетический, в остальных же случаях Athlon II X4 ни в чём не уступил Phenom II X4.
Игровые тесты
реклама
Мы уже неоднократно убеждались, что в реальном программном обеспечении картина производительности зачастую совсем иная, так что давайте уже перейдём к реальному ПО, начав с игрового.
Grand Theft Auto V (2015, RAGE, DX11)
В старой-доброй GTA V существенной разницы в относительной производительности между различными вариантами графических настроек не наблюдается — на одинаковых частотах ("в стоке") Phenom II X6 немного обгоняет Phenom II X4, который, в свою очередь, так же незначительно обходит Athlon II X4. В разгоне из-за различного разгонного потенциала тестируемых экземпляров разрыв между процессорами AMD становиться больше. Касательно сравнения Phenom II X6 с "гиперпнём", видим, что в разгоне "старичку" даже удаётся обойти последний, причём на всех вариантах настроек. Разница, впрочем, находится на границе погрешности измерений. Отметьте так же, что на минимальных настройках 6-ядерный Phenom обходит 4-ядерный преимущественно по средней производительности при практически идентичной минимальной, но с ростом настроек 6-ядерник выходит вперёд и по статистике редких событий. Grand Theft Auto V вполне себе умеет эффективно использовать более 4 потоков, просто на минимальных настройках особой пользы от пары "лишних" ядер не наблюдалось. Но стоило поднять настройки и стабильность частоты кадров на 6-ядерном Phenom стала заметно лучше в сравнении с 4-ядерными коллегами. В плане играбельности стабильные 30 FPS можно получить и на "гиперпне", и на Phenom II X4/X6 даже на "ультрах", правда в разгоне, пускай и небольшом. Athlon II X4 выступил чуть хуже — но у него и кэша L3 нет, и разгон совсем невпечатляющий.
Sid Meier's Civilization VI (2016, Собственный, DX11)
В ещё одной довольно популярной DirectX 11 игре прошлых лет Phenom II X6 в разгоне уже обходит "гиперпень", пускай преимущественно и по стабильности частоты кадров. 4-ядерные Phenom II и Athlon II выступают чуть скромнее, но даже их достаточно для стабильных 30 FPS на ультра-настройках качества, причём достаточно даже "в стоке". А ещё в Civilization VI польза от 6 ядер видна уже на "минималках" и с ростом настроек качества она никуда не исчезает.
Total War: Warhammer II (2017, TW Engine 3, DX11)
Похожую на GTA V картину производительности можно видеть и в популярной стратегии Creative Assembly, по крайней мере, в режиме боя (Battle Benchmark), в котором игра неплохо масштабируется по потокам. По средним показателям "гиперпень" всё же немного впереди разогнанного Phenom II X6, но преимущество незначительно. 4-ядерные процессоры Phenom II и Athlon II вновь выступают заметно хуже независимо от уровня настроек графики. Ультра-настройки вновь можно себе позволить и на "гиперпне" и на процессорах из прошлого, последние, правда, желательно немного разогнать.
А вот в режиме кампании (Campaign Benchmark) большая часть нагрузки ложится всего лишь на один поток, так что здесь Phenom II X6 на равных частотах (в стоке) практически не отрывается от Phenom II X4, И TurboCore тут 6-ядернику не помощник, так как несмотря на преимущественно однопоточный характер нагрузку, потоков игра создаёт достаточно для того, чтобы функция TurboCore не активировалась. А вот Athlon II X4 на той же стоковой частоте чувствует себя чуть хуже из-за отсутствия L3-кэша. В разгоне Phenom II X6 отрывается от Phenom II X4, а тот, в свою очередь, от Athlon II X4 попросту за счёт более высокого разгонного потенциала протестированных экземпляров.
Middle-earth: Shadow of War (2017, Firebird Engine, DX11)
Middle-earth: Shadow of War так же подавай высокую однопоточную производительность — здесь проку от дополнительной пары ядер в Phenom II X6 в сравнении с Phenom II X4 практически нет. "Гиперпень" лидирует, но с небольшим отрывом, да и даже на ультра-настройках проблем пользователи старых процессоров AMD не испытают — даже лишённый кэша L3 Athlon II X4 в стоке способен обеспечить стабильные 40 FPS.
F1 2018 (2018, EGO Engine, DX11)
В автосимуляторе Codemasters паре дополнительных ядер нашлось применение на всех уровнях настройки графики — Phenom II X6 заметно обгоняет Phenom II X4 и по медиане, и 1-ому процентилю FPS. Наличие L3-кэша важно чуть в меньшей степени, но Athlon II X4 всё же позади Phenom II X4 даже на равных частотах. Впрочем, и высокой однопоточной производительностью игра не брезгует, так что "гиперпень" всё же впереди, да и в разгоне разрыв между процессорами AMD растёт за счёт различного разгонного потенциала. С ультра-настройками вновь никаких проблем — и "гиперпень" и Phenom в разгоне обеспечат стабильные 60 FPS.
Shadow of the Tomb Raider (2018, Foundation Engine, DX12)
Hitman 2 (2018, Glacier 2, DX12)
Настал черёд более серьёзных испытаний. Первая пара DirectX 12 игр из списка бенчмарков демонстрирует интересные, но в целом ожидаемые, результаты — современным играм, написанным под современные API, важна не только высокая однопоточная производительность, но и большое количество ядер/потоков. И в Shadow of the Tomb Raider, и в Hitman 2 "гиперпень" был наконец повержен 6-ядерным Phenom в разгоне. Причём выше оказалась не только средняя производительность, но и стабильность частоты кадров. Phenom II X6 вообще оказался единственным процессором, который смог обеспечить стабильные 30 FPS в указанных играх. 4-ядерный Phenom II до заветной отметки немного недотянул, впрочем, и на современных 2 ядрах и 4 потоках этим играм уже так же "душно".
Far Cry New Dawn (2019, Dunia 2, DX11)
Несмотря на использование "старой" версии API DirectX, игра Ubisoft демонстрирует поведение, близкое к вышеописанному у современных DirectX 12 игр. Да, прирост от пары дополнительных ядер в Phenom II ниже, да и наблюдается почти паритет 6-ядерного "старичка" в разгоне с "гиперпнём", но первый всё же впереди. Ультра-настройки в Far Cry New Dawn менее требовательный к производительности центрального процессора — стабильные 30 FPS тут смогли обеспечить почти все участники даже на стоковых частотах.
Metro Exodus (2019, 4A Engine, DX12)
В последней на данный момент части Metro, ситуация несколько нестандартная — несмотря на использование DirectX 12, от наличия двух дополнительных ядер K10 независимо от настроек графики подрастает в первую очередь именно средняя производительность, а не стабильность времени кадра. В разгоне Phenom II X6 идёт с "гиперпнём" "ноздря в ноздрю" так же на всех протестированных настройках. Ультра-настройки в этой игре дались участникам тестирования ещё с большим трудом, чем в Shadow of the Tomb Raider и Hitman 2 — до абсолютно стабильных 30 FPS недотянул никто, хотя "гиперпень" и 6-ядерный Phenom в разгоне подошли к заветной отметке максимально близко.
Borderlands 3 (2019, Unreal Engine 4, DX12)
И, наконец, в Borderlands 3 вновь наблюдаем типичную для DirectX 12 проектов картину — производительность 6-ядерного Phenom II заметно выше 4-ядерного собрата, а наличие кэша L3 менее важно. "Гиперпень" вновь повержен 6-ядерником в разгоне на всех вариантах графических настроек. Ультра-настройки для участников тестирования опять же не приговор, как минимум в разгоне.
Среднегеометрические результаты
Что ж, в этот раз игры были протестированы не только на минимальных настройках качества и в целом получилась не такая уж и плачевная картина.
- 4 и 6-ядерные процессоры второго поколения многоядерных решений микроархитектуры K10 всё ещё могут обеспечить стабильные 30 FPS в современных играх даже на ультра-настройках. Да, в некоторых наиболее тяжёлых для центрального процессора играх для этого требуется умеренный разгон, но много где хватает и "стока".
- Конечно, не стоит забывать о том, что в K10 отсутствует поддержка наборов инструкций SSE4.x, из-за чего на Athlon II и Phenom II нет возможности запускать некоторые современные игры (например, Assassin's Creed Odyssey и Red Dead Redemption 2). Заметьте, что решение разработчика таких игр об отсутствии поддержки "старых" процессоров в свете полученных результатов выглядит маркетологическим — чистой вычислительной производительности "старичкам", скорее всего, хватило бы, а без использования SSE4 -инструкций можно было и обойтись. Но имеем, то, что имеем.
- Очевидно, также, что современный "гиперпень", демонстрирующий игровую производительность того же порядка, характеризуется более низким энергопотреблением и тепловыделением, особенно в сравнении с процессорами AMD прошлых лет в разгоне. Не то, чтобы это обстоятельство имело критически важное значение, но упомянуть стоило.
- В среднем дополнительная пара ядер в Phenom II X6 даёт порядка 15% дополнительной производительности, а максимум порядка 30%, так что оправдать такой прирост почти трёхкратной переплатой очень сложно — например, на Aliexpress цены на 4-ядерные Phenom II начинаются примерно с 1000 ₽, а за 6-ядерного представителя той же линейки просят уже минимум 3000 ₽. Так что всем каким-то чудом "застрявшим" на Socket AM3 с 4-ядерным Phenom II вряд ли стоит обновляться до 6-ядерного варианта. Современные решения того же уровня ("гиперпень" и иже с ним), так же неинтересны, так как и это обновление по результатам тестов выглядит как "шило на мыло".
Неигровые тесты
Но не всё же в игры играть. Как говорится, "делу время, потехе час". Давайте посмотрим, измениться ли картина относительной производительности тестируемых процессоров при переходе к неигровым приложениям. Для этих целей были отобраны несколько наиболее интересных широкой аудитории тестов из пакета SPECworkstation 3.
- Рендеринг в Blender, как известно, хорошо масштабируется на большое количество потоков, но IPC и частоты современных процессоров значительно выше. так что на стоковых частотах производительности даже 6 ядерного Phenom II всё ещё недостаёт для борьбы даже с 2-ядерным 4-поточным "гиперьпнём". В разгоне Phenom II X6 уже способен обойти указанного современного конкурента, а вот остальные участники забега всё ещё остаются позади.
- Задача видеокодирования также известна своей хорошей масштабируемостью по имеющимся ядрам/потокам, но при кодировании видео в H.265 посредством известного пакета Handbrake "гиперпень" всё же обгоняет даже разогнанный 6-ядерный Phenom. При этом технология аппаратного ускорения кодирования и декодирования видео Intel Quick Sync Video не используется, так что превосходство "гиперпня" объясняется, скорее всего, просто значительно более высоким IPC для случая каких-то наиболее используемых при кодировании видео инструкции. Например, возможно, кодер H.265 сильно выигрывает от использования инструкций из наборов SSE4.x, которые K10 недоступны. Или здесь-таки упираемся в узкое место микроархитектуры K10 — сравнительно низкую производительность подсистемы памяти.
- Пакет для классической молекулярной динамики LAMMPS известен высокой эффективностью своей параллельной реализации, так что толк от пары "лишних" ядер в Phenom II X6 виден невооружённым взглядом и здесь. В этот раз обошлось без сюрпризов — Phenom II X6 в разгоне обошёл "гиперпень".
- Архиваторы известны своей любовью к количеству ядер, так что победа Phenom II X6 даже на стоковых частотах над "гипернём" в тестах 7zip удивления не вызывает. А уж в разгоне 6-ядерный "старичок" AMD вообще не оставляет современному бюджетному процессору Intel никаких шансов.
- А вот в системе для математических вычислений GNU Octave (свободная замена MATLAB) важна в первую очередь однопоточная производительность — здесь и толку от пары дополнительных ядер K10 нет, и "гиперпень" заметно опережает даже разогнанный 6-ядерный Phenom.
- В тестах Python измеряется производительность различных математических и статистических операций с использованием популярных библиотек numpy и scipy. Определённые проблемы с масштабируемостью имеются — прирост от пары дополнительных ядер K10 есть, но незначительный. Впрочем, 6 ядер этой микроархитектуры в умеренном разгоне хватает, чтобы обойти гиперпень.
Как видим, в неигровом программном обеспечении картина может быть различной — где-то масштабируемость по ядрам/потокам настолько хороша, что даже несмотря на сравнительно высокий IPC и частоты, 6-ядерный представитель микроархитектуры K10 может тягаться с современным 2-ядерным 4-поточным процессором и даже побеждать, а где-то важнее однопоточная производительность и "гиперпень" легко обходит 6-ядерного "старичка". Ну а 4-ядерные представители K10 уступают "гиперпню" почти всегда и везде.
Вот такая получается картина. На этом, пожалуй, прощаемся с платформой AM3, так как большая часть программы по исследованию её производительности выполнена. Методики тестирования плюс-минус отработана, так что теперь можно двигаться дальше.
реклама
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила