В прошлый раз мы остановились на тестировании 4-ядерных Phenom второго поколения с DDR3-памятью, вплотную подойдя к 6-ядерным моделям указанной линейки процессоров. К сожалению, разыгравшиеся вскоре во всём мире события существенно замедлили тестирование Phenom II X6, так что планировавшиеся сроки публикации результатов сильно сдвинулись, но здесь, как говорится, "лучше поздно, чем никогда". Сегодня сравним игровую производительность Phenom II X6 1055T с таковой у ранее протестированного Phenom II X4 925, использую в качестве ориентира современного "игрового" процессора, как и ранее, "гиперпень".
Если говорить о 6-ядерных процессорах, то нетрудно заметить, что только сейчас, в 2020 году, они начинают становиться "мейнстримом" в домашних компьютерах, где всё ещё господствуют их "младшие" 4-ядерные собратья. Сложившаяся ситуация может показаться несколько удивительной на фоне того факта, что первые 6-ядерные процессоры для настольных ПК были выпущены на рынок аж более 10 лет назад! И если первое 6-ядерное предложение Intel (Core i7-980X) относилось к сегменту высокопроизводительных настольных систем (HEDT) и отличалось высокой (по меркам обычных ПК) стоимостью в $999, то первые 6-ядерные процессоры AMD (Phenom II X6 1090T и 1055T) были значительно доступнее (рекомендованные цены составляли $289 и $199, соответственно) и ориентировались не на обеспеченных энтузиастов, а на обычных домашних пользователей ПК. В свете вышесказанного, становится очевидным, что злую шутку с распространением первых 6-ядерных моделей процессоров для настольных ПК в массы сыграла отнюдь не их заоблачная стоимость, а, по всей видимости, сложность разработки и до какой-то степени нетипичность параллельного программного обеспечения на платформе ПК, из-за которой ещё долгое время даже дорогое профессиональное ПО на настольных компьютерах получало незначительный прирост от дополнительной пары ядер. Как следствие, продавались первые 6-ядерные процессоры значительно хуже своих 4-ядерных собратьев, так как на практике обладали заметно меньшим соотношением производительности к цене. В свою очередь ничтожно малая доля 6-ядерных решений на рынке настольных ПК делала задачу оптимизации программного обеспечения под эти процессоры не приоритетной, что порождало замкнутый круг.
Однако, за прошедшие с момента появления первых 6-ядерных процессоров для настольных систем 10 лет ситуация в индустрии разработки ПО изменилась — писать параллельные программы год от года становилось всё проще, так что пускай оптимизация ПО для настольных систем под более чем 4 вычислительных ядра и не была приоритетной задачей у многих разработчиков, она худо-бедно постепенно решалась всё большим и большим их числом. Продвижению 6-ядерных моделей процессоров на рынке безусловно способствовал и выход очередных сравнительно недорогих и крайне удачных 6-ядерных процессоров AMD (Ryzen 5), ставших хитом продаж уже в первом поколении, не говоря о поколениях последующих. Что же, стоит отдать должное компании AMD за стойкость на пути внедрения многоядерных процессоров в настольном сегменте — то, что по независящим от компании объективным причинам не получилось в 2010, она попыталась сделать ещё раз в 2017, и на этот раз уже однозначно успешно. Но сегодня, как уже должно быть понятно из заголовка, речь пойдёт не о современных и успешных Ryzen 5, а об их "древних" (по меркам компьютерной индустрии) и не столь успешных предках Phenom II X6, которых, принимая во внимание существование ещё и "6-ядерных" процессоров поколения FX, можно считать "дедушками Ryzen 5".
Если говорить об архитектуре, то ничего кардинально нового в ядре Thuban, положенного в основу Phenom II X6, не было — "новое" ядро представляло собой по своей сути простое расширение ядра Deneb, которое успешно использовалось в процессорах Phenom II X4. Конечно, у нового кристалла имелось на целых два ядра больше, что теоретически при равных тактовых частотах могло вылиться в увеличение быстродействия на 50%, вот только на практике такой прирост производительности почти не наблюдался по нескольким причинам:
Кроме того, на практике тактовые частоты 6-ядерных чипов пускай и незначительно, но всё же уступали таковым у 4-ядерных моделей: так, например, частота старшего на момент выхода линейки Phenom II X6 1090T составляла 3.2 ГГц, а старший на тот момент Phenom II X4 970 мог похвастаться 3.5 ГГц. Впрочем, у AMD имелся ответ на эту досадную ситуацию — явленная миру технология Turbo Core могла в ситуации, когда загруженными оказывались менее 4 ядер, повышать частоту одной половины ядер на несколько сотен МГц, при этом существенно замедляя вторую неиспользуемую половину ядер. Таким образом, новые 6-ядерные процессоры должны были быть, как минимум, не медленнее своих 4-ядерных предшественников даже в приложениях, не оптимизированных под многопоточность.
Технология Turbo Core стала ответом на технологию конкурента (Intel Turbo Boost), пускай и заметно отличавшейся от последней в плане алгоритма работы. Отметим так же, что в процессорах Ryzen на смену Turbo Core пришла технология Precision Boost, использующая более тонкие алгоритмы и опирающаяся на большее количество показателей. А о Turbo Core можно сказать лишь, что как в синтетических тестах производительности AIDA64, так и в протестированных современных играх Phenom II X6 с включенной и выключенной технологией Turbo Core демонстрирует практически идентичные результаты.
Виной тому многопоточный характер, присущий большей части современного программного обеспечения, с лёгкостью нагружающей (пускай не всегда в полной мере и максимально эффективно) 4 и более ядер. Как следствие, сценарий активации Turbo Core практически никогда не реализуется на практике, так что можно утверждать, что технология Turbo Core абсолютно бесполезна в современных играх. Детальные результаты в обоих режимах можно посмотреть в таблице, здесь же лишь отметим, что Phenom II X6 1055T с выключенным Turbo Core даже чуть быстрее себя же с Turbo Core включенным, правда всего на 1%, что находится на границе погрешности измерений. В свете выше сказанного, было решено при представлении результатов тестов производительности приводить только один вариант Phenom II X6 "в стоке", а именно, вариант с выключенной функцией Turbo Core, который, впрочем, можно интерпретировать и как вариант с включенной функцией Turbo Core, так как результаты, как уже было сказано, практически идентичны.
Касательно конкуренции на момент выхода Phenom II X6 необходимо отметить, что первые 6-ядерные процессоры AMD для настольных ПК серьёзно уступали первому же 6-ядерному предложению конкурента в лице Core i7-980X — даже будучи разогнанными выше 4 ГГц, Phenom II X6 не были способны обеспечить превосходство над предложением Intel в большинстве задач. Однако, 6-ядерные Phenom II никогда и не позиционировались как конкуренты более чем втрое превосходившему из по стоимости Core i7-980X (Bloomfield) на в целом дорогой HEDT-платформе LGA1366, а были нацелены на конкуренцию с 4-ядерными Core i5 и i7 (Lynnfield) для "обычной" настольной платформы LGA1156.
И на фоне указанных прямых конкурентов Phenom II X6 смотрелись в целом достойно — обычно выступали на равных с 4-ядерными 4-поточными Core i5 и немного отставали от 4-ядерных 8-поточных Core i7. Основным архитектурным недостатком Phenom II X6 по сравнении с новыми на тот момент процессорами конкурента было недостаточное для обслуживания 6 ядер быстродействие встроенного контроллера памяти и недостаточный же для 6 ядер объем кэш-памяти третьего уровня. Впрочем, в реальных сценариях использования отставание от равных по стоимости продуктов конкурента если и имелось, то было незначительным, к тому же оно с лихвой нивелировалось чуть более низкой ценой, отсутствием необходимости в покупке новой материнской платы и неплохим разгонным потенциалом, так что Phenom II X6 продавались достаточно хорошо, пускай и не так долго. Давайте же сегодня посмотрим, что смогут эти процессоры в современных играх.
Основы тестовых стендов AM3 и LGA 1151 те же, что и ранее, а именно материнские платы ASUS M4A79T Deluxe и MSI B250M PRO-VD, соответственно. Остальные комплектующие, кроме оперативной памяти, идентичны: видеокарта GeForce GTX 1060 6 ГБ от Inno3D, бюджетный SSD WD Green на 240 ГБ под Windows и приложения, жесткий диск Seagate 7200 BarraCuda на 3 ТБ под игры, блок питания Xilence Performance A+ 630 Вт.
Тестовый стенд AM3 на основе ASUS M4A79T Deluxe за работой
Первый стенд оснащён 2 планками DDR3-1600 CL9 памяти с Aliexpress объёмом по 4 ГБ каждая, о которой подробнее писалось в прошлой заметке, второй — 2 планками DDR4-2400 CL17 памяти так же объёмом по 4 ГБ каждая. Процедура разгона на платформе AM3 принципиально ничем не отличалась от описанной ранее для AM2+, ограничения те же — не выше 1.5 В на ядра и встроенный контроллер памяти. Phenom II X4 925 продемонстрировал идентичный ранее полученному с использованием платы GIGABYTE GA-MA770-UD3 (rev. 2.0) разгонный потенциал — 260 МГц "по шине" и 3.6 ГГц итоговой частоты ядер, Phenom II X6 1055T показал себя чуть лучше, покорив планку в 280 МГц "по шине", почти добравшись до 4 ГГц по частоте ядер. Множитель встроенного контроллера памяти 10 в обоих случаях, что даёт эффективную частоту работы этого узла 2.6 и 2.8 ГГц соответственно. В стоке память DDR3-1600 CL9 для обоих процессоров, в разгоне DDR3-1733 CL9 и DDR3-1866 CL10 для Phenom II X4 и X6, соответственно. В последнем случае предпочтение были отдано более высокой частоте и чуть более высоким же таймингам, так как оставаясь на CL9 можно было получить лишь DDR3-1493, что хуже по производительности, чем даже вариант "в стоке".
Параметры Phenom II X4 925 "в стоке" и в разгоне
Параметры Phenom II X6 1055T "в стоке" и в разгоне
Начинаем традиционно с результатов синтетических тестов AIDA64.
Результаты в тестах памяти по-прежнему не впечатляют — даже в комплексном разгоне (увеличение не только частоты процессора, но и контроллера памяти), представители микроархитектуры K10 в связке с DDR3-1600 памятью значительно отстают от G4600 с DDR4-2400 памятью. Причём, результаты Phenom II X6 в тестах записи даже несколько хуже таковых у Phenom II X4, что, скорее всего, объясняется тем простым фактом, что архитектурно идентичному контроллеру памяти в 6-ядерном процессоре приходится обслуживать на 50% большее число ядер.
На диаграммах, приведённых ниже результаты оценки производительности процессоров AMD в тестах CPU и FPU вновь, как и ранее, для наглядности приведены относительно таковых для Pentium G4600, показатели которого взяты за 1.
Тесты производительности вычислительных блоков ЦП также демонстрируют уже привычную картину — в большинстве тестов 6-ядерный Phenom II X6 "в стоке" наступает "гиперпню" на пятки или даже незначительно обгоняет последнего, а в разгоне способен без труда обойти современный 2-ядерник, причём преимущество может быть более чем двукратным. В очередной раз отметим, однако, что на практике реализуется подобный сценарий только в случае, если используемое программное обеспечение хорошо масштабируется на большое количество потоков, не упирается в производительность подсистемы памяти и мало что получает от использования новых инструкций. И в отличие от синтетических бенчмарков, в реальных приложениях, и особенно в играх, такая ситуация, скорее, редкость.
Вначале необходимо сказать об обновлении методики тестирования игровой производительности. В самой первой заметке из цикла (см. раздел Методика тестирования) был объяснён изначальный выбор игровых проектов для проведения тестирования, однако, практика показала, что этот список можно сократить не только без ущерба для качества результатов, но даже ему на пользу. Основная идея в сокращении количества игровых бенчмарков, думаю, ясна — имеющееся в распоряжении тестировщика время ограничено, так что нужно потратить его с максимальной пользой. Изначально для целей тестирования были отобраны 19 игровых проектов, причём многие тестировались с использованием нескольких доступных API, так что суммарное количество игровых бенчмарков почти достигало 30. Практика показала, что такое внушительное число бенчмарков требует нескольких дней на сбор и анализ данных для одной компьютерной системы даже если ограничиться одним разрешением и одним набором настроек качества. Поэтому было принято решение сократить число бенчмарков, руководствуясь старым-добрым принципом "Лучше меньше, да лучше". Итак, в обновлённой методике:
Руководствуясь этими принципами, количество игровых бенчмарков было сокращено до дюжины, что существенно сократило время проведения тестирования, при этом незначительно повлияв на результаты в смысле средней сравнительной производительности компьютерных систем. Так, например, одним из основных результатов исследования по новой методике является установление того факта, что "в стоке" Phenom II X6 1055T обгоняет равный ему по частоте Phenom II X4 925 на 14% и 16% по показателям медианного FPS и 1-ого процентиля FPS, в то время как по старой методике показатели превосходства 6-ядерного чипа составляли 13% и 14% по указанным показателям, соответственно. Так что, как можно видеть, разница действительно несущественна, и можно утверждать, что при использовании старой методики много времени впустую тратилось на бенчмарки, не привносившие в общую картину ничего нового. И да, теперь при обсуждении результатов игровых бенчмарков используются метрики медианы FPS и 1-ого процентиля FPS, вместо среднего (арифметического) FPS, 1% и 0.1% низких FPS, использовавшихся ранее. Более подробно об этих показателях и причинах перехода от одних к другим будет в ближайщем будующем рассказано отдельно, сейчас же отметим что:
Grand Theft Auto V (2015, RAGE, DX11)
Sid Meier's Civilization VI (2016, Собственный, DX11)
Две всё ещё сильно популярных DirectX 11 игры прошлых лет демонстрируют в целом одинаковую картину относительной производительности на 4/6 ядрах поколения K10: на одинаковых частотах ("в стоке") Phenom II X6 обгоняет Phenom II 4 на примерно 15% по обоим показателям игровой производительности. А касательно сравнения Phenom II X6 с "гиперпнём", видим, что в разгоне "старичку" даже удаётся обойти последний, преимущественно по стабильности частоты кадров.
Total War: Warhammer II (2017, TW Engine 3, DX11)
А вот популярной стратегии Creative Assembly подавай высокую однопоточную производительность — и толку от пары дополнительных ядер K10 почти нет, и "гиперпень" у Phenom II X6 догнать не получается.
Middle-earth: Shadow of War (2017, Firebird Engine, DX11)
Ситуация в Middle-earth: Shadow of War чуть лучше: по крайней мере в среднем от пары "лишних" ядер K10 есть хоть какой-то толк, да и "гиперпень" по медиане FPS догнать почти получается.
F1 2018 (2018, EGO Engine, DX11)
А вот в автосимуляторе Codemasters паре дополнительных ядер нашлось применение — Phenom II X6 обгоняет Phenom II 4 на внушительные 26% и 15% по медиане и 1-ому процентилю FPS. Но и высокой однопоточной производительностью игра не брезгует, так что "гиперпень" всё же впереди.
Shadow of the Tomb Raider (2018, Foundation Engine, DX12)
Hitman 2 (2018, Glacier 2, DX12)
Far Cry New Dawn (2019, Dunia 2, DX11)
Когда-нибудь один из крупнейших разработчиков (и издателей) компьютерных игр начнёт делать и выпускать игры на современных API, а до тех пор в играх Ubisoft придётся довольствоваться типичным для DIrectX 11 поведением — незначительный прирост от пары дополнительных ядер K10 и паритет 6-ядерного "старичка" в разгоне с "гиперпнём".
Metro Exodus (2019, 4A Engine, DX12)
Borderlands 3 (2019, Unreal Engine 4, DX12)
А вот в Borderlands 3 вновь наблюдаем типичную для DirectX 12 картину: производительность 6-ядерного Phenom II в среднем выше на 20%, а стабильность времени кадра аж на целых 30%. Да и "гиперпень" 6-ядерником в разгоне безоговорочно повержен.
Итак, в целом по игровым тестам наблюдается следующая картина:
Какие из всего этого можно сделать выводы?
На этом пока всё. Не болейте!