Из спичек и желудей — что может "дедушка" 6-ядерных Ryzen в современных играх
реклама
Введение
В прошлый раз мы остановились на тестировании 4-ядерных Phenom второго поколения с DDR3-памятью, вплотную подойдя к 6-ядерным моделям указанной линейки процессоров. К сожалению, разыгравшиеся вскоре во всём мире события существенно замедлили тестирование Phenom II X6, так что планировавшиеся сроки публикации результатов сильно сдвинулись, но здесь, как говорится, "лучше поздно, чем никогда". Сегодня сравним игровую производительность Phenom II X6 1055T с таковой у ранее протестированного Phenom II X4 925, использую в качестве ориентира современного "игрового" процессора, как и ранее, "гиперпень".
реклама
Если говорить о 6-ядерных процессорах, то нетрудно заметить, что только сейчас, в 2020 году, они начинают становиться "мейнстримом" в домашних компьютерах, где всё ещё господствуют их "младшие" 4-ядерные собратья. Сложившаяся ситуация может показаться несколько удивительной на фоне того факта, что первые 6-ядерные процессоры для настольных ПК были выпущены на рынок аж более 10 лет назад! И если первое 6-ядерное предложение Intel (Core i7-980X) относилось к сегменту высокопроизводительных настольных систем (HEDT) и отличалось высокой (по меркам обычных ПК) стоимостью в $999, то первые 6-ядерные процессоры AMD (Phenom II X6 1090T и 1055T) были значительно доступнее (рекомендованные цены составляли $289 и $199, соответственно) и ориентировались не на обеспеченных энтузиастов, а на обычных домашних пользователей ПК. В свете вышесказанного, становится очевидным, что злую шутку с распространением первых 6-ядерных моделей процессоров для настольных ПК в массы сыграла отнюдь не их заоблачная стоимость, а, по всей видимости, сложность разработки и до какой-то степени нетипичность параллельного программного обеспечения на платформе ПК, из-за которой ещё долгое время даже дорогое профессиональное ПО на настольных компьютерах получало незначительный прирост от дополнительной пары ядер. Как следствие, продавались первые 6-ядерные процессоры значительно хуже своих 4-ядерных собратьев, так как на практике обладали заметно меньшим соотношением производительности к цене. В свою очередь ничтожно малая доля 6-ядерных решений на рынке настольных ПК делала задачу оптимизации программного обеспечения под эти процессоры не приоритетной, что порождало замкнутый круг.
Однако, за прошедшие с момента появления первых 6-ядерных процессоров для настольных систем 10 лет ситуация в индустрии разработки ПО изменилась — писать параллельные программы год от года становилось всё проще, так что пускай оптимизация ПО для настольных систем под более чем 4 вычислительных ядра и не была приоритетной задачей у многих разработчиков, она худо-бедно постепенно решалась всё большим и большим их числом. Продвижению 6-ядерных моделей процессоров на рынке безусловно способствовал и выход очередных сравнительно недорогих и крайне удачных 6-ядерных процессоров AMD (Ryzen 5), ставших хитом продаж уже в первом поколении, не говоря о поколениях последующих. Что же, стоит отдать должное компании AMD за стойкость на пути внедрения многоядерных процессоров в настольном сегменте — то, что по независящим от компании объективным причинам не получилось в 2010, она попыталась сделать ещё раз в 2017, и на этот раз уже однозначно успешно. Но сегодня, как уже должно быть понятно из заголовка, речь пойдёт не о современных и успешных Ryzen 5, а об их "древних" (по меркам компьютерной индустрии) и не столь успешных предках Phenom II X6, которых, принимая во внимание существование ещё и "6-ядерных" процессоров поколения FX, можно считать "дедушками Ryzen 5".
Введение
реклама
Если говорить об архитектуре, то ничего кардинально нового в ядре Thuban, положенного в основу Phenom II X6, не было — "новое" ядро представляло собой по своей сути простое расширение ядра Deneb, которое успешно использовалось в процессорах Phenom II X4. Конечно, у нового кристалла имелось на целых два ядра больше, что теоретически при равных тактовых частотах могло вылиться в увеличение быстродействия на 50%, вот только на практике такой прирост производительности почти не наблюдался по нескольким причинам:
- Во-первых, масса программного обеспечения для настольных компьютеров тех лет была толком не оптимизирована не то что под наличие 6, но и 4 ядер.
- Во-вторых, подсистема памяти, зачастую становившаяся узким местом уже у 4-ядерных чипов, не претерпела в 6-ядерниках никаких существенных изменений — встроенный контроллер памяти остался практически идентичным, объёмы и характеристики кэшей L1, L2 и L3 так же сохранились.
Кроме того, на практике тактовые частоты 6-ядерных чипов пускай и незначительно, но всё же уступали таковым у 4-ядерных моделей: так, например, частота старшего на момент выхода линейки Phenom II X6 1090T составляла 3.2 ГГц, а старший на тот момент Phenom II X4 970 мог похвастаться 3.5 ГГц. Впрочем, у AMD имелся ответ на эту досадную ситуацию — явленная миру технология Turbo Core могла в ситуации, когда загруженными оказывались менее 4 ядер, повышать частоту одной половины ядер на несколько сотен МГц, при этом существенно замедляя вторую неиспользуемую половину ядер. Таким образом, новые 6-ядерные процессоры должны были быть, как минимум, не медленнее своих 4-ядерных предшественников даже в приложениях, не оптимизированных под многопоточность.
Технология Turbo Core стала ответом на технологию конкурента (Intel Turbo Boost), пускай и заметно отличавшейся от последней в плане алгоритма работы. Отметим так же, что в процессорах Ryzen на смену Turbo Core пришла технология Precision Boost, использующая более тонкие алгоритмы и опирающаяся на большее количество показателей. А о Turbo Core можно сказать лишь, что как в синтетических тестах производительности AIDA64, так и в протестированных современных играх Phenom II X6 с включенной и выключенной технологией Turbo Core демонстрирует практически идентичные результаты.
реклама
Виной тому многопоточный характер, присущий большей части современного программного обеспечения, с лёгкостью нагружающей (пускай не всегда в полной мере и максимально эффективно) 4 и более ядер. Как следствие, сценарий активации Turbo Core практически никогда не реализуется на практике, так что можно утверждать, что технология Turbo Core абсолютно бесполезна в современных играх. Детальные результаты в обоих режимах можно посмотреть в таблице, здесь же лишь отметим, что Phenom II X6 1055T с выключенным Turbo Core даже чуть быстрее себя же с Turbo Core включенным, правда всего на 1%, что находится на границе погрешности измерений. В свете выше сказанного, было решено при представлении результатов тестов производительности приводить только один вариант Phenom II X6 "в стоке", а именно, вариант с выключенной функцией Turbo Core, который, впрочем, можно интерпретировать и как вариант с включенной функцией Turbo Core, так как результаты, как уже было сказано, практически идентичны.
Касательно конкуренции на момент выхода Phenom II X6 необходимо отметить, что первые 6-ядерные процессоры AMD для настольных ПК серьёзно уступали первому же 6-ядерному предложению конкурента в лице Core i7-980X — даже будучи разогнанными выше 4 ГГц, Phenom II X6 не были способны обеспечить превосходство над предложением Intel в большинстве задач. Однако, 6-ядерные Phenom II никогда и не позиционировались как конкуренты более чем втрое превосходившему из по стоимости Core i7-980X (Bloomfield) на в целом дорогой HEDT-платформе LGA1366, а были нацелены на конкуренцию с 4-ядерными Core i5 и i7 (Lynnfield) для "обычной" настольной платформы LGA1156.
И на фоне указанных прямых конкурентов Phenom II X6 смотрелись в целом достойно — обычно выступали на равных с 4-ядерными 4-поточными Core i5 и немного отставали от 4-ядерных 8-поточных Core i7. Основным архитектурным недостатком Phenom II X6 по сравнении с новыми на тот момент процессорами конкурента было недостаточное для обслуживания 6 ядер быстродействие встроенного контроллера памяти и недостаточный же для 6 ядер объем кэш-памяти третьего уровня. Впрочем, в реальных сценариях использования отставание от равных по стоимости продуктов конкурента если и имелось, то было незначительным, к тому же оно с лихвой нивелировалось чуть более низкой ценой, отсутствием необходимости в покупке новой материнской платы и неплохим разгонным потенциалом, так что Phenom II X6 продавались достаточно хорошо, пускай и не так долго. Давайте же сегодня посмотрим, что смогут эти процессоры в современных играх.
реклама
Основы тестовых стендов AM3 и LGA 1151 те же, что и ранее, а именно материнские платы ASUS M4A79T Deluxe и MSI B250M PRO-VD, соответственно. Остальные комплектующие, кроме оперативной памяти, идентичны: видеокарта GeForce GTX 1060 6 ГБ от Inno3D, бюджетный SSD WD Green на 240 ГБ под Windows и приложения, жесткий диск Seagate 7200 BarraCuda на 3 ТБ под игры, блок питания Xilence Performance A+ 630 Вт.
Тестовый стенд AM3 на основе ASUS M4A79T Deluxe за работой
Первый стенд оснащён 2 планками DDR3-1600 CL9 памяти с Aliexpress объёмом по 4 ГБ каждая, о которой подробнее писалось в прошлой заметке, второй — 2 планками DDR4-2400 CL17 памяти так же объёмом по 4 ГБ каждая. Процедура разгона на платформе AM3 принципиально ничем не отличалась от описанной ранее для AM2+, ограничения те же — не выше 1.5 В на ядра и встроенный контроллер памяти. Phenom II X4 925 продемонстрировал идентичный ранее полученному с использованием платы GIGABYTE GA-MA770-UD3 (rev. 2.0) разгонный потенциал — 260 МГц "по шине" и 3.6 ГГц итоговой частоты ядер, Phenom II X6 1055T показал себя чуть лучше, покорив планку в 280 МГц "по шине", почти добравшись до 4 ГГц по частоте ядер. Множитель встроенного контроллера памяти 10 в обоих случаях, что даёт эффективную частоту работы этого узла 2.6 и 2.8 ГГц соответственно. В стоке память DDR3-1600 CL9 для обоих процессоров, в разгоне DDR3-1733 CL9 и DDR3-1866 CL10 для Phenom II X4 и X6, соответственно. В последнем случае предпочтение были отдано более высокой частоте и чуть более высоким же таймингам, так как оставаясь на CL9 можно было получить лишь DDR3-1493, что хуже по производительности, чем даже вариант "в стоке".
Параметры Phenom II X4 925 "в стоке" и в разгоне
Параметры Phenom II X6 1055T "в стоке" и в разгоне
AIDA64
Начинаем традиционно с результатов синтетических тестов AIDA64.
Результаты в тестах памяти по-прежнему не впечатляют — даже в комплексном разгоне (увеличение не только частоты процессора, но и контроллера памяти), представители микроархитектуры K10 в связке с DDR3-1600 памятью значительно отстают от G4600 с DDR4-2400 памятью. Причём, результаты Phenom II X6 в тестах записи даже несколько хуже таковых у Phenom II X4, что, скорее всего, объясняется тем простым фактом, что архитектурно идентичному контроллеру памяти в 6-ядерном процессоре приходится обслуживать на 50% большее число ядер.
На диаграммах, приведённых ниже результаты оценки производительности процессоров AMD в тестах CPU и FPU вновь, как и ранее, для наглядности приведены относительно таковых для Pentium G4600, показатели которого взяты за 1.
Тесты производительности вычислительных блоков ЦП также демонстрируют уже привычную картину — в большинстве тестов 6-ядерный Phenom II X6 "в стоке" наступает "гиперпню" на пятки или даже незначительно обгоняет последнего, а в разгоне способен без труда обойти современный 2-ядерник, причём преимущество может быть более чем двукратным. В очередной раз отметим, однако, что на практике реализуется подобный сценарий только в случае, если используемое программное обеспечение хорошо масштабируется на большое количество потоков, не упирается в производительность подсистемы памяти и мало что получает от использования новых инструкций. И в отличие от синтетических бенчмарков, в реальных приложениях, и особенно в играх, такая ситуация, скорее, редкость.
Игровые тесты
Вначале необходимо сказать об обновлении методики тестирования игровой производительности. В самой первой заметке из цикла (см. раздел Методика тестирования) был объяснён изначальный выбор игровых проектов для проведения тестирования, однако, практика показала, что этот список можно сократить не только без ущерба для качества результатов, но даже ему на пользу. Основная идея в сокращении количества игровых бенчмарков, думаю, ясна — имеющееся в распоряжении тестировщика время ограничено, так что нужно потратить его с максимальной пользой. Изначально для целей тестирования были отобраны 19 игровых проектов, причём многие тестировались с использованием нескольких доступных API, так что суммарное количество игровых бенчмарков почти достигало 30. Практика показала, что такое внушительное число бенчмарков требует нескольких дней на сбор и анализ данных для одной компьютерной системы даже если ограничиться одним разрешением и одним набором настроек качества. Поэтому было принято решение сократить число бенчмарков, руководствуясь старым-добрым принципом "Лучше меньше, да лучше". Итак, в обновлённой методике:
- Во-первых, основной упор был сделан на максимально актуальные игровые проекты, то есть проекты 2018-2019 годов. В обновлённом списке бенчмарков присутствует лишь по 1 игре 2015 и 2016 годов выпуска, 2 игры 2017 года и по 4 проекта 2018 и 2019 годов. При этом было сделано всё, чтобы сохранить широкий спектр жанров, "движков" и API насколько это, конечно, было возможно.
- Во-вторых, было решено отказаться от тестирования "старых" проектов в режиме "новых" API, так как в этом крайне мало смысла, ибо реализация этих режимов далека от совершенства и результаты ничего кроме этого факта обычно не демонстрируют. Таким образом игровые проекты 2015-2017 годов тестируются в режиме DirectX 11, а более поздние — (преимущественно) в режиме DirectX 12.
Руководствуясь этими принципами, количество игровых бенчмарков было сокращено до дюжины, что существенно сократило время проведения тестирования, при этом незначительно повлияв на результаты в смысле средней сравнительной производительности компьютерных систем. Так, например, одним из основных результатов исследования по новой методике является установление того факта, что "в стоке" Phenom II X6 1055T обгоняет равный ему по частоте Phenom II X4 925 на 14% и 16% по показателям медианного FPS и 1-ого процентиля FPS, в то время как по старой методике показатели превосходства 6-ядерного чипа составляли 13% и 14% по указанным показателям, соответственно. Так что, как можно видеть, разница действительно несущественна, и можно утверждать, что при использовании старой методики много времени впустую тратилось на бенчмарки, не привносившие в общую картину ничего нового. И да, теперь при обсуждении результатов игровых бенчмарков используются метрики медианы FPS и 1-ого процентиля FPS, вместо среднего (арифметического) FPS, 1% и 0.1% низких FPS, использовавшихся ранее. Более подробно об этих показателях и причинах перехода от одних к другим будет в ближайщем будующем рассказано отдельно, сейчас же отметим что:
- Медиана наряду со средним арифметическим часто используется в качестве так называемой меры центральной тенденции, или по-простому, среднего значения величины из некоторого набора данных. Преимущество медианы заключаются в том, что её оценки обычно робастны, или выбросоустойчивы, а среднее арифметическое робастной величиной не является. В нашем случаем, правда, пока ни разу не довелось наблюдать существенного расхождения между средним арифметическим FPS и медианой FPS, однако, здесь и далее будем использовать именно медиану. Во-первых, потому, что робастность этой характеристики всегда выше, чем у среднего арифметического, а во-вторых, для единообразия — математический смысл медианы аналогичен таковому у 1-ого процентиля (так как медиана, собственно, тоже суть есть процентиль, только 50-й).
- 1-й процентиль на самом деле использовался нами и ранее, однако ошибочно именовался 1% низким FPS. Эти характеристики близки к друг другу по смыслу и взаимосвязаны, но всё же различны: 1% низкий FPS — это среднее арифметическое значений мгновенного FPS, попавших в 1-й процентиль. Мне, признаться, схема обработки данных с усреднением значений процентилей не нравится, так как весь смысл использования процентилей как раз и состоит в том, чтобы нивелировать влияние выбросов, а на величину 1% низких FPS выбросы будут оказывать более существенное влияние, чем на процентили. Так что продолжим вычислять и использовать именно процентили, просто теперь будем их правильно называть в таблицах и на диаграммах.
- 0.1% низкий FPS, приводившийся ранее, и так же как 1% низкий FPS, являвшийся, строго говоря соответствующим процентилем, более не приводится, так как в ходе анализа получаемых данных было замечено, что в абсолютном большинстве случаев при прогоне игрового бенчмарка на выходе получается всего несколько тысяч значений времени кадра, 0.1% от нескольких тысяч — это всего-навсего несколько кадров, чаще всего 1-2, которые могут являться выбросами, от влияния которых мы, вообще говоря, и хотим избавиться. Нескольких тысяч кадров попросту недостаточно, для того чтобы величина 0.1-ого процентиля была робастной.
Grand Theft Auto V (2015, RAGE, DX11)
Sid Meier's Civilization VI (2016, Собственный, DX11)
Две всё ещё сильно популярных DirectX 11 игры прошлых лет демонстрируют в целом одинаковую картину относительной производительности на 4/6 ядрах поколения K10: на одинаковых частотах ("в стоке") Phenom II X6 обгоняет Phenom II 4 на примерно 15% по обоим показателям игровой производительности. А касательно сравнения Phenom II X6 с "гиперпнём", видим, что в разгоне "старичку" даже удаётся обойти последний, преимущественно по стабильности частоты кадров.
Total War: Warhammer II (2017, TW Engine 3, DX11)
А вот популярной стратегии Creative Assembly подавай высокую однопоточную производительность — и толку от пары дополнительных ядер K10 почти нет, и "гиперпень" у Phenom II X6 догнать не получается.
Middle-earth: Shadow of War (2017, Firebird Engine, DX11)
Ситуация в Middle-earth: Shadow of War чуть лучше: по крайней мере в среднем от пары "лишних" ядер K10 есть хоть какой-то толк, да и "гиперпень" по медиане FPS догнать почти получается.
F1 2018 (2018, EGO Engine, DX11)
А вот в автосимуляторе Codemasters паре дополнительных ядер нашлось применение — Phenom II X6 обгоняет Phenom II 4 на внушительные 26% и 15% по медиане и 1-ому процентилю FPS. Но и высокой однопоточной производительностью игра не брезгует, так что "гиперпень" всё же впереди.
Shadow of the Tomb Raider (2018, Foundation Engine, DX12)
Hitman 2 (2018, Glacier 2, DX12)
Первая пара DirectX 12 игр из списка бенчмарков демонстрирует в целом ожидаемые результаты — большее число ядер в первую очередь увеличивает стабильность кадров, а не среднюю производительность, а на 2 ядрах и 4 потоках играм уже "душно".
Far Cry New Dawn (2019, Dunia 2, DX11)
Когда-нибудь один из крупнейших разработчиков (и издателей) компьютерных игр начнёт делать и выпускать игры на современных API, а до тех пор в играх Ubisoft придётся довольствоваться типичным для DIrectX 11 поведением — незначительный прирост от пары дополнительных ядер K10 и паритет 6-ядерного "старичка" в разгоне с "гиперпнём".
Metro Exodus (2019, 4A Engine, DX12)
В последней на данный момент времени части Metro, несмотря на использование DirectX 12, от наличия двух дополнительных ядер K10 подрастает в первую очередь именно средняя производительность, а не стабильность времени кадра. В разгоне Phenom II X6 идёт с "гиперпнём" "ноздря-в-ноздрю".
Borderlands 3 (2019, Unreal Engine 4, DX12)
А вот в Borderlands 3 вновь наблюдаем типичную для DirectX 12 картину: производительность 6-ядерного Phenom II в среднем выше на 20%, а стабильность времени кадра аж на целых 30%. Да и "гиперпень" 6-ядерником в разгоне безоговорочно повержен.
Выводы
Итак, в целом по игровым тестам наблюдается следующая картина:
- В стоке Phenom II X6 1055T обгоняет равный ему по частоте Phenom II X4 925 в среднем на 14% и 16% по показателям медианного FPS и 1-ого процентиля. В разгоне, чуть более высокий разгонный потенциал 6-ядерного Phenom несколько увеличивает отрыв, но в целом ситуация остаётся неизменной — 16% и 20% по указанным показателям. Так что можно сделать очевидный вывод, что толку от дополнительной пары ядер в Phenom II X6 в современных играх немного — ни о каких дополнительных 50% производительности речи и не идёт, максимум удаётся приблизиьтся к 25% прибавке к медианному FPS в некоторых играх, да получить прибавку примерно того же порядка к 1-ому процентилю FPS, но опять же, не во всех случаях.
- Следует, однако, понимать, что полученные результаты не свидетельствуют о бесполезности 6-ядерных процессоров в современных играх в целом, а лишь о том, что дополнительная (к уже имеющимся 4) пара ядер не сильно полезна в чипах поколения AMD K10. У представителей более современных процессорных микроархитектур масштабирование с 4 до 6 ядер может отличаться в лучшую сторону, а низкий прирост при переходе от 4 к 6 ядрам у процессоров K10 может быть обусловлен общеизвестным узким местом этой микроархитектуры — слабой подсистемой памяти.
- Если рассматривать ситуацию с производительностью игр на DirectX 11 и DirectX 12 в целом, то при использовании "старой" версии API прирост от дополнительной пары ядер составляет всего 11% по обсуждаемым показателям игровой производительности, а вот игры на новой версии DirectX могут похвастаться ростом показателей уже на 17% и 24%, соответственно. Эти данные в очередной раз подтверждают хорошо известный тезис о том, что большая эффективность DirectX 12 в использовании ресурсов многоядерных процессоров проявляется не столько в возросшем среднем FPS, сколько в большей стабильности частоты кадров.
- Современный 2-ядерный 4-поточный Pentium G4600 по-прежнему обгоняет "старичка" (на сей раз в лице 6-ядерного Phenom II X6 1055T) в стоке на внушительные 32% и 27% по показателям медианного FPS и 1-ого процентиля, а вот в разгоне от преимущества "гиперпня" не остаётся и следа — Pentium G4600 всё ещё обходит разогнанный до 3.9 ГГц Phenom II X6 1055T по показателю медианного FPS, но всего лишь на 1%, а вот по 1-ому процентилю даже уступает 5%.
Какие из всего этого можно сделать выводы?
- В общем и целом производительности Phenom II X6 в неэкстремальном разгоне до ~4.0 ГГц вкупе с отнюдь не самой быстрой DDR3 памятью оказывается всё ещё достаточно для всех протестированных игр текущей пятилетки на минимальных настройках качества. Как минимум стабильные 30 FPS удалось получить в абсолютном большинстве игровых проектов. Впрочем, все протестированные игровые проекты оказались играбельны "на минималках" и на Phenom II X4 в схожем неэкстремальном разгоне с той же самой DDR3-памятью.
- В среднем дополнительная пара ядер в Phenom II X6 даёт порядка 15% дополнительной производительности, а максимум порядка 30%, но оправдать такой незначительный прирост почти трёхкратной переплатой сложно — например, на Aliexpress цены на 4-ядерные Phenom II начинаются с 1000 ₽, а за 6-ядерного представителя той же линейки просят уже минимум 2800 ₽.
- Всем каким-то чудом "застрявшим" на Socket AM3 и задумавшимся об апгрейде, похоже, не стоит рассматривать в качестве варианта обновления решения уровня "гиперпня", так как это обновление по результатам тестов выглядит как "шило на мыло". Единственные важные преимущества современных бюджетных платформ — поддержка наборов инструкций SSE4.x, из-за отсутствия которой на Phenom II нет возможности запускать некоторые современные игры (например, Assassin's Creed Odyssey и Red Dead Redemption 2), а так же более низкое энергопотребление и тепловыделение.
На этом пока всё. Не болейте!
реклама
Теги
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила