Сравнение эффективности Hyper-threading и SMT. Нужен ли i7-9700K?
Неоднократно слышал о более эффективной реализации логических ядер от AMD, в этом сравнении попробуем выяснить так ли это.
реклама
Тестовые стенды
Тестовый ПК AMD
реклама
• ЦП: AMD Ryzen 7 2700X , разгон до 4250 МГц
• МП: ASUS PRIME X470-PRO
• Видеокарта: MSI GeForce GTX 1080 GAMING X plus;
• ОЗУ: G.Skill Trident Z 2x8 GB (F4-3600C15D-16GTZ), 3533 МГц 14-15-14-28-42
реклама
• Охлаждение ЦП: AIO be quiet! Silent Loop 280mm
• SSD: Kingston SSD A400 120GB (Windows 10 Pro со всеми обновлениями, тестовые программы)
• SSD: Samsung SSD 850 EVO 250GB (Игры)
• БП: CoolerMaster V550 550W [RS550-AFBAG1-EU]
реклама
• Корпус: практически открытый стенд
Тестовый ПК Intel
• ЦП: Intel Core i7-8700K, разгон до 5000 МГц, кольцевая шина 4700 МГц
• МП: ASUS PRIME Z370-A
• Видеокарта: ASUS GeForce GTX 1080 Ti STRIX (Биос OC версии)
• ОЗУ: G.Skill Trident Z 2x8 GB (F4-3600C15D-16GTZ), XMP профиль 3600 МГц
• Охлаждение: жидкостное охлаждение ЦП и видеокарты
• SSD: SSD Smartbuy 240GB MLC (Windows 10 Pro со всеми обновлениями, тестовые программы)
• SSD: Samsung SSD 850 EVO 250GB (Игры)
• БП: CoolerMaster V850 850W [RS850-AFBAG1-EU]
• Корпус: Fractal Design Define R5
Стоит обратить внимание, что на системе Intel память способна работать на более высокой частоте, но стабильности в желаемых режимах достигнуть не удалось, оставим это на будущее. Также и для системы AMD режим работы памяти не является предельно возможным, стабильность на более высокой частоте - предмет дальнейших тестов. Что интересно - свежий чип позволяет экспериментировать с этим достаточно широко, мой прошлый опыт с Ryzen 1700 и X370 ограничился 3333 МГц при Cl 14. Режимы работы памяти буду считать приблизительно равными, с учётом более удачного контроллера у Intel, да и при попытке уравнять подсистему памяти можно надолго уйти в настройку и ещё больше времени отдать философским размышлениям в духе «но ведь интол может большую частоту», а при тестировании в максимально возможных режимах Intel теоретически получит нежелательную фору, величину которой предсказать не берусь.
Разницу в производительности системных ССД вряд ли можно считать сколь-либо значимой.
Методика тестирования
Сравнения процессоров в номинальных режимах работы оставим материалам на других порталах, для этого сравнения использовались разогнанные ЦП. Продукт от Intel для этого пришлось подвергнуть скальпированию, AMD же лишила меня такого интересного времяпрепровождения. В итоге имеем заветные 5 ГГц от Intel при довольно высоком напряжении 1,36. Экземпляр от AMD стабильно работает на 4250 МГц при напряжении 1,3 и совершенно не боится нагрузки linx, требуя только адекватного охлаждения, вариант необслуживаемой системы с радиатором 280 мм, видимо, является минимумом при такой нагрузке.
Для выяснения эффективности реализации логических процессоров от конкурирующих компаний неплохо бы иметь 8 или 12-ядерные процессоры от Intel на массовой платформе и 12 или 16-ядерные от AMD в той же весовой категории, чтобы результаты массовых процессоров со сравниваемыми технологиями столкнуть с этими воображаемыми монстрами с отключением HT/SMT. Пока это невозможно, но уже вот-вот производители грозят насыпать ядер всем и каждому, стремительно загоняя массовую платформу (даже не HEDT) в ценовую категорию бюджетных автомобилей!
Имея то, что имеем, сравнивать будем процессоры в режимах с отключенными ядрами/HT/SMT во всевозможных комбинациях. Для удобства чтения режим работы ЦП буду обозначать комбинацией двух чисел, пример "8700K 6-12" здесь и далее в таком обозначении первое число обозначает активные ядра, второе - потоки и намекает на включение или, наоборот, отключение HT/SMT
Краеугольными считаю режимы 3-3, 3-6 и 6-6 для Intel и, соответственно, 4-4, 4-8, 8-8 для AMD. Они дают представление о приросте производительности при добавлении логических ядер процессору или же добавления аналогичного количества реальных ядер. Свои выводы постараюсь сделать на основе этих режимов, но результаты всех вариантов тестирования предоставлю для упражнений в арифметике всем читателям. Там, где это уместно, добавлю теоретическую производительность одного потока (просто поделю результат на количество потоков) для более солидного вида диаграмм. Оставим без внимания реализацию общения ядер внутри кристалла и немного прикроем глаза на повышение требований к подсистеме памяти при увеличении потоков, да и сложности с повышением влияния фоновых задач при уменьшении количества ядер будем только иметь в виду.
По возможности проводились многократные тестирования с усреднением результатов. Тестовые программы подбирались с оглядкой на задействование многопоточности, эффективность масштабируемости, распространённость и определяющее - наличие уже на ПК.
Результаты тестов
Cinebench R15
Любимая игра разгонятелей процессоров после Линкса. Популярный тест даёт представление о способностях ЦП в рендеринге трёхмерного контента.
Напомню, что синим обозначены не результат теста при использовании одного ядра, а именно отношение результата к количеству потоков. Редкий случай - прекрасная масштабируемость результата.
Используя матан и вычитание, видим прибавку результата у 8700K в режимах 3-6 и 6-6 относительно 3-3 в 209 и 631 балл соответственно, что даёт нам приблизительное значение эффективности логического ядра на уровне 0,33 от эффективности физического ядра. В дальнейшем именно такими вычислениями буду получать этот коэффициент. Для 2700Х аналогичные изыскания в режимах 4-4, 4-8 и 8-8 дают коэффициент 0,45, что ощутимо выше результата процессора синих. Вот и первый намёк на правдивость изначального предположения.
AIDA 5.97.4600
Из обилия тестов этого пакета выберем «CPU Queen» методом выбора первого в списке.
В отличии от Cinebench здесь уже видно уменьшение производительности каждого потока при увеличении их количества, нестрогое следование теории можно оправдать только не совсем идеальной повторяемостью результатов.
Коэффициенты эффективности: HT – 0,47, SMT – 0,75. Эффективность технологий очень высока, но у некоторых компаний выше других. Наглядно этот результат видно отлично у 8700K в режимах 4-8 и 6-6, 2 физических ядра добавляют лишь немногим больше 4 логических в конечный результат по сравнению с режимом 4-4.
7zip 18.05
Популярный архиватор, результат получим в MIPS!
Коэффициенты эффективности: HT – 0,31, SMT – 0,45. Результат очень напоминает полученный в Cinebench R15.
WinRar 5.40
Популярный архиватор, с лецензированием отлитым в мемах, результат получим в КБ/с.
Результаты неоднозначны и вгоняют в ступор. Ясно только, что архиватор этот гораздо эффективнее на системах Intel и не только общим результатом, но и эффективностью логических ядер. Коэффициенты эффективности: HT – 0,6, SMT – 0,32.
Geekbench 4.2.3
Комплексный тест, эмулирующий реальное использование ПК в программных продуктах разной направленности.
Тесты ожидаемо включают как те, где логические процессоры эффективны, так и наоборот - не очень. Коэффициенты эффективности: HT – 0,24, SMT – 0,35. Наглядно результат видно на результате 2700X в режимах 6-12 и 8-8, добавление 6 логических ядер даёт практически такую же прибавку в производительности, как и 2 физических относительно режима 6-6.
Ссылки на расшифровки результатов на сайте программы сохранил и, возможно, попробую сделать более подробное сравнение позже.
Игры
Переходим к играм, и тут есть все основания отказаться от ранее используемой методики, потому как масштабируемости и способности использовать многопоток в количестве больше 8 не завезли практически ни в одну игру. Будем использовать встроенные тесты.
Отличие в производительности видеоподсистемы значительное, и даже при снижении разрешения в играх до 720p не удалось полностью избавиться от моментов с загрузкой видеочипа более 95 процентов - особенность тестовых отрезков, встроенных в игры бенчмарков. Потому прямого сравнения производительности двух систем в играх не вышло, что, впрочем, и не являлось целью исследования.
Assassin’s Creed Origins
Современный Ассасин в несовременном Египте должен отвечать за процессорозависимые игры настоящего.
Удивительное рядом, результаты с включенными логическими ядрами выше, большая редкость в играх. Вплоть до 12 потов видно ощутимое повышение производительности от увеличения логических и не только ядер.
Повторюсь – видеокарты использовались совсем разные, для сравнения систем между собой картинка не подходит, только междусобойчик одноцветных потоков: красных с красными, синих с синими. Причём 8700К не представлен в режимах 3-3 и 3-6, что-то там уже обновилось и результаты уже не могут быть объективными, сомневаюсь, что это важно - 3 ядра маловато для современной игры.
Rise of the Tomb Raider
Аналогичная ACO функция, но уже от игры недавнего настоящего.
Вакханалия цвета и неожиданно самые высокие результаты у 8700K в режиме 4-4, у 2700X – 6-6. Чётко видно устоявшуюся тенденцию увеличения производительности при отключении HT/SMT.
World of Tanks enСore
Будет отдуваться за популярные ММО и сетевые игры, малопоточная нагрузка и в тесте случайно.
Результат ожидаем, практически нет разницы сколько ядер у процессора, а вот HT/SMT всё-таки лучше отключить, если вы не стример.
Выводы
Ограниченное количество тестов позволяет категорично заявлять, что, действительно, технология AMD эффективнее технологии Intel (хм, на патенте AMD) и преимущество ощутимо - около 50%. Прочувствовать это можно только в приложениях, использующих все возможности многопоточности и не упирающихся в возможности подсистемы памяти.
Для игр в массе своей, наоборот, ни одна из этих технологий не может считаться эффективной, так как чаще снижает производительность. Предположу, что организация дополнительного потока на силах физического ядра снижает пиковую производительность этого самого одного ядра, а играм чаще всего одно быстрое ядро гораздо важнее их количества (верно для количества ядер больше 3, чудо пни – компромисс). Вдохновляет, что появляются уже игры, способные использовать HT/SMT во благо, и радужные (в хорошем смысле) перспективы преобладают!
Что касается планов Intel, то выход 9700K посеет определённую неопределённость и подарит выбор, но только при условии одинаковой цены с 8700К. Судя по полученным результатам, в большинстве задач 9700K 8-8 будет более производительным, чем 8700К 6-12, особенно в уже вышедших играх и выходящих в ближайшее время. В рабочих же приложениях будет наблюдаться паритет, либо незначительное отставание 8700K. В узком круге задач 8700К будет впереди, но эти задачи не входят в число наиболее часто выполняемых на этом типе процессоров.
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила