Изучаем влияние технологии Hyper-Threading на производительность в играх - большой тест

Как технология Hyper-Threading влияет на производительность в играх? Сегодня это выясним на примере процессора i7 10700K с разным количеством активных ядер. Тесты как с трассировкой лучей, так и без.
27 января 2023, пятница 08:41
Winssy для раздела Блоги

Прочитав комментарии к предыдущему тесту, было решено сделать дополнение. Оно касается технологии многопоточности. Сейчас посмотрим, как сильно влияет на производительность в играх отключение HT (Hyper-Threading) с разным количеством активных ядер. 

Hyper-Threading - это технология от Интел позволяющая на одном ядре процессора обрабатывать сразу два потока данных. В процессорах АМД так же присутствует подобная технология, но носит другое название - Simultaneous MultiThreading (SMT).     

Сегодня дополняем прошлое тестирование данными следующих конфигураций процессора - 8с/8t, 6c/6t и 4c/4t (ядра/потоки). Большинство результатов в режимах 8c/16t, 6c/12t и 4c/8t были взяты из прошлого теста. Они никак не изменились за эти несколько дней т.к конфигурация оборудования, игровые настройки и игровые сохранения, служившие стартом для тестирования, остались прежними. Иными словами, данные полностью актуальны. Исключением стала лишь Watch Dogs Legion. В этой игре тест пришлось полностью переделать со всеми вариантами активных ядер + HT т.к. внутри игры изменилось время суток, а вернуться в игровой момент из прошлого теста возможности не было. 

Предыдущий тест по ссылке - "Тест процессора Core i7-10700K с разным количеством активных ядер в играх."

Во время тестирования частота процессора, как и в прошлом тесте, была зафиксирована на отметке 5.0 ГГц, частота кольцевой шины на отметке 4,6 ГГц. Память от G.Skill с XMP профилем 4000 МГц 19-19-19-39 1,35v работала в разгоне путем максимального возможного снижения таймингов при безопасном вольтаже для B-die чипов 1,45v. Изменяемыми параметрами сегодня были количество активных ядер - 8, 6 и 4, и включение/отключение технологии HT.     




Тестовая конфигурация и методика тестирования

Итак, приступим.

Настройки графики во всех играх подбирались таким образом, чтобы исключить упор в видеокарту.

Методика тестирования была следующая. Для теста выбирался определенный отрезок игры или игрового бенчмарка, он прогонялся не менее пяти раз, а значения 0,1%, 1% и средний fps замерялись программой MSI Afterburner. На графиках представлены средние значения по результатам всех прогонов. Я также буду выкладывать серии скриншотов из каждой игры с разным количеством активных ядер. Это нужно для того, чтобы вы могли сами оценить нагрузку на ядра в каждом случае.

Тестовая конфигурация:

  • Процессор - i7 10700k@5.0 ГГц 1,318v
  • ОЗУ - G.Skill Trident Z 2x16GB DDR4 F4-4000C19D-32GTZKK (4000 МГц, 16-16-16-34, 1,45v)
  • Материнская плата - MSI MPG Z490 GAMING PLUS
  • Охлаждение - Noctua NH-D15S
  • Видеокарта - ASUS TUF Gaming GeForce RTX 3080 V2 OC Edition 10GB LHR
  • Накопитель - SSD WD Blue 3D NAND 1TB WDS100T2B0B
  • Блок питания - Cooler Master V1000 1000Вт
  • Операционная система - Windows 10 Pro 22H2


The Witcher 3: Wild Hunt

Первой игрой на сегодня будет Ведьмак 3. Тест будет проходить в DX11.

Настройки графики.

Разрешение 1080р, пресет "Запредельный" за исключением настройки NVIDIA HairWorks.



10700K@5.0  8c/16t

10700K@5.0  8c/8t

10700K@5.0  6c/12t

10700K@5.0  6c/6t

10700K@5.0  4c/8t

10700K@5.0  4c/4t


Результаты тестов


Хорошо видно, что в данной игре отключение HT ведет к потере производительности. В случае с шести и четырьмя ядрами к довольно существенной.

Лидером стали 8 ядер / 16 потоков, на втором месте с отставанием 2% по среднему fps оказались 6 ядер / 12 потоков и на третье место с отставанием по среднему fps в 4% вышли 8 ядер / 8 потоков. Конфигурации 6c/12t и 8с/8t показали примерно одинаковую производительность в том числе и по показателям 1% и 0,1%. 

Также почти равную производительность выдали 6 ядер / 6 потоков и 4 ядра / 8 потоков с незначительным перевесом 6c/6t.

Хочу отметить, что 4 ядра / 4 потока не просто показали худший результат, игра на четырех потоках постоянно и очень сильно фризила. Это хорошо видно по показателю 1% и 0,1%, а также по графику времени кадров на скриншоте.


Расстановка сил между всеми конфигурациями следующая. (За 100% здесь и далее будет браться результат 8c/16t)


Теперь посмотрим, как отключение HT повлияло на производительность в этой игре относительно количества активных ядер.


В случае с 8-ми активными ядрами отключение HT понизило средний fps всего на 4%. На 6-ти и 4-х ядрах падение больше - в районе 20%.


Horizon Zero Dawn

Следующей игрой в тесте будет Horizon Zero Dawn. Несмотря на то, что тестирование в этой игре проводилось во встроенном бенчмарке, данные я собирал с помощью MSI Afterburner. Делалось это для того, чтобы все показатели во всех играх были получены при помощи одного и того же средства.

Настройки графики.

Разрешение 1080р, пресет "Приоритет качества"


10700K@5.0  8c/16t

10700K@5.0  8c/8t

10700K@5.0  6c/12t

10700K@5.0  6c/6t

10700K@5.0  4c/8t

10700K@5.0  4c/4t


Результаты тестов


В данной игре 8 ядер без HT показали лучшую производительность опередив 8 ядер / 16 потоков по среднему fps на 4%. 

Видимо Horizon Zero Dawn не слишком требовательна к количеству ядер/потоков процессора (во всяком случае в бенчмарке) и все конфигурации показали хороший результат по среднему fps. Немного портит картину лишь результат 4c/8t и 4c4t по 0,1%. С 4-мя ядрами как с HT так и без в бенчмарке наблюдались редкие фризы, их-за чего показатель 0,1% откровенно плох. 


В процентном соотношении разница между конфигурациями выглядит следующим образом.


Стоит отметить, что отключение HT ведет к более существенному снижению 1% и 0,1%, чем среднего fps.

 

Посмотрим в процентах, как отключение HT повлияло на производительность в Horizon Zero Dawn.


В этой игре в случае с 8-ми активными ядрами отключение HT повысило средний fps на 4%. На 6-ти и 4-х ядрах уже наблюдается падение производительности, на 3% и 11%. 


Cyberpunk 2077 

Это первая игра на сегодня с трассировкой лучей, соответственно в ней будет два теста - RT on и RT off. 

Для теста вместо бенчмарка был выбран определенный отрезок игры.


Настройки графики.

1. Разрешение 1080р, пресет "Средний", плотность толпы "Высокая".

2. Разрешение 1080р, пресет "Средний", плотность толпы "Высокая"  + RT ультра + DLSS производительность.



10700K@5.0  8c/16t

10700K@5.0  8c/16t  RT + DLSS

10700K@5.0  8c/8t

10700K@5.0  8c/8t  RT + DLSS

10700K@5.0  6c/12t

10700K@5.0  6c/12t  RT + DLSS

10700K@5.0  6c/6t

10700K@5.0  6c/6t  RT + DLSS

10700K@5.0  4c/8t

10700K@5.0  4c/8t  RT + DLSS

10700K@5.0  4c/4t

10700K@5.0  4c/4t  RT + DLSS


Результаты тестов


Без RT бесспорным лидером стали 8 ядер с технологией HT, т.е. со всеми 16-ю потоками. На втором и третьем месте расположились 6 ядер / 12 потоков и 8 ядер / 8 потоков, отставание по среднему фпс составило 10% и 13% соответственно. Как видно из теста, Киберпанк любит потоки, предпочитая 6 ядер с HT чистым 8-ми ядрам.

Похожую производительность показали конфигурации 6c/6t и 4с/8t. По среднему fps немного вперед вышли 6 ядер без технологии многопоточности, хотя показатели 1% и 0,1% примерно равны.   

4 ядра без HT ожидаемо показали худший результат. 

Хочется отметить, что на конфигурациях 4c/4t и 4c/8t наблюдались микрофризы. Особенно в первом случае. 


Переходим к тесту с RT


После включения технологии трассировки лучей расстановка сил не изменилась. По-прежнему лидирует полноценная версия процессора, 6 ядер / 12 потоков на втором месте, на третьем 8 ядер / 8 потоков, а на 4-х ядрах опять наблюдаются микрофризы как с HT, так и без. 

Похожую производительность показали конфигурации 6c/6t и 4с/8t с небольшим преимуществом первой. 


Общий результат выглядит так. 



Отключение HT, как c RT так и без, только снижает производительность процессора в этой игре с любым количеством ядер.


Посмотрим на снижение производительности по среднему fps после отключения HT для 8-ми, 6-ти и 4-х ядер в процентах.


Как видно на графике, в Cyberpunk 2077 чем меньше активных ядер у процессора, тем сильнее снижается его производительность после отключения технологии Hyper-Threading. На 8-ми ядрах fps, как с RT так и без, снизился на 13%, на 6-ти - 18% и 15%, на 4-х - 28% и 23%. При этом стоит отметить, без RT снижение получилось чуть больше.


Watch Dogs Legion

Еще одна игра с трассировкой лучей. Посмотрим, что покажут в ней различные варианты ядер/потоков.

В данной игре был выбран тестовый отрезок вместо внутриигрового бенчмарка.


Настройки графики.

1. Разрешение 1080р, пресет "Очень высокий".

2. Разрешение 1080р, пресет "Очень высокий" + RT + DLSS качество.



10700K@5.0  8c/16t

10700K@5.0  8c/16t  RT + DLSS

10700K@5.0  8c/8t

10700K@5.0  8c/8t  RT + DLSS

10700K@5.0  6c/12t

10700K@5.0  6c/12t  RT + DLSS

10700K@5.0  6c/6t

10700K@5.0  6c/6t  RT + DLSS

10700K@5.0  4c/8t

10700K@5.0  4c/8t  RT + DLSS

10700K@5.0  4c/4t

10700K@5.0  4c/4t  RT + DLSS


Результаты тестов


В данной игре отключение HT негативно повлияло на производительность во всех случаях. 

В тесте без трассировки лидером стали 8 ядер с HT, что вполне ожидаемо. А вот между конфигурациями процессора 8c/8t и 6c/12t, а также 6c/6t и 4c/8t получилась интересная картина. Производительность каждой пары оказалась идентична, разница на уровне погрешности. 


А теперь посмотрим на результат теста с RT.


Тест с трассировкой лучей полностью повторяет результат теста без трассировки, за исключением просевшей производительности от дополнительной нагрузки. Лидер остался прежний, а между 8c/8t и 6c/12t, а также 6c/6t и 4c/8t, практически полный паритет.

Нужно отметить, что на 4-х ядрах / 8-ми потоках были редкие микрофризы, а на 6-ти ядрах без HT, несмотря на равную производительность, этого не наблюдалось. На 4-х ядрах без HT фризы были достаточно сильные. 


Общая картина выглядит так.



Теперь посмотрим на снижение производительности по среднему fps после отключения HT для 8-ми, 6-ти и 4-х ядер в процентах.


Наименьшее падение производительности после отключения HT было на 8-ми ядрах - 7-9%, а на 6-ти и 4-х ядрах падение оно уже больше - 21-24%.


Shadow of the Tomb Raider

Последней игрой сегодня будет Shadow of the Tomb Raider.

Для теста использовался третий отрезок внутриигрового бенчмарка, замер проводился с помощью MSI Afterburner.


Настройки графики.

1. Разрешение 1080р, пресет "Низкий".

2. Разрешение 1080р, пресет "Низкий" + RT + DLSS производительность.


10700K@5.0  8c/16t

10700K@5.0  8c/16t  RT + DLSS

10700K@5.0  8c/8t

10700K@5.0  8c/8t  RT + DLSS

10700K@5.0  6c/12t

10700K@5.0  6c/12t  RT + DLSS

10700K@5.0  6c/6t

10700K@5.0  6c/6t  RT + DLSS

10700K@5.0  4c/8t

10700K@5.0  4c/8t  RT + DLSS

10700K@5.0  4c/4t

10700K@5.0  4c/4t  RT + DLSS


Результаты тестов


В данной игре лучший результат по среднему fps показали 8 ядер с отключенной технологией HT, хотя по 1% и 0,1% наблюдается небольшое отставание от 8 ядер с HT. На втором месте конфигурация 8c/16t, на третьем 6c/12t. В противостоянии 6c/6t и 4c/8t по среднему fps побеждают 6 ядер. 



Посмотрим на результат теста с RT.


После активации RT поменялся лидер, теперь это 8 ядер, но уже с включенной технологией HT, а 8 ядер / 8 потоков показывают производительность близкую к 6 ядрам / 12 потокам. 

После отключения HT, в отличие от теста без RT, производительность снизилась во всех случаях.  

На 4 ядрах / 4 потоках наблюдались редкие микрофризы с включенным RT.

Разница между конфигурациями выглядит следующим образом.



Если рассмотреть противостояния 8c/8t vs 6c/12t и 6c/6t vs 4c/8t, то можно заметить, что несмотря на более высокий средний фпс у первых, у них т то же время сильнее просадка по 1% и 0,1%. Это говорит о том, что хоть в целом кадров было больше, но они были менее стабильными.  


Посмотрим, как повлияло отключения HT на производительность 8-ми, 6-ти и 4-х ядер в процентах.


Как и в Cyberpunk 2077, чем меньше активных ядер у процессора, тем сильнее снижается его производительность после отключения технологии HT. Исключением стали лишь 8 ядер / 8 потоков в тесте без RT. Там производительность немного подросла. 

На 8-ми ядрах средний fps без RT увеличился на 1%, c RT упал на 5%. На 6-ти упал на 8% и 12%, на 4-х упал на 20% и 25%. Здесь, в отличие от Киберпанка, в тесте без RT снижение получилось меньше, чем с RT.


Выводы

Можно однозначно сказать, что отключение HT в более новых и действительно тяжелых для процессора играх, только снижает производительность. Это и не удивительно, ведь эти игры создавались уже с расчетом на многопоток. В более старых играх ситуация немного другая и отключение HT может слегка поднять производительность по среднему fps. Но есть один момент, при этом весьма вероятно снижение показателей редких и очень редких событий и мы имеем картину, когда в среднем кадров больше, но они менее стабильны. При этом ядер в любом случае должно быть не менее восьми, иначе, как показали тесты, после отключения HT производительность только снизится. Я не буду говорить о действительно старых или более легких для процессора играх, там все может быть иначе. 

Интересно, что 8 ядер / 8 потоков в целом показывают близкую производительность к 6 ядрам / 12 потокам. В двух играх fps был примерно равен, в двух 8 ядер / 8 потоков немного быстрее и в одной слегка медленнее. Однако стоит отметить, что медленнее 8 ядер оказались как раз в самой тяжелой для процессора игре - Cyberpunk 2077. А это значит, что потоки действительно важны для тяжелых проектов.

Не менее интересно противостояние 6 ядер / 6 потоков и 4 ядер / 8 потоков. Производительность довольна близка, но перевес все же оказался на стороне 6 ядер.