33 статьи: играем с Phenom (1 из 3)



33 СТАТЬИ: ИГРАЕМ С PHENOM
---== Часть 1. Пробный шар ==---

В этой работе представлены сводные данные о производительности AMD Phenom II X4 955 (BE) и Intel Core i7 в играх, составленные по статьям-обзорам этих процессоров. Для сравнения учитываются Q9400, Q9450, Q9550, Q9650. Процессор AMD интересен автору как самый молодой и неизвестный.

На просторах интернета было найдено более 40 тестов с участием нужного Phenom; из их числа, после отсева дубликатов отобрано 33 статьи с обязательным участием двух главных соперников (список статей приведен в третьей части). Их авторы проявляют солидарность в выборе двух главных конкурентов.

Наиболее важным аспектом такой сводной оценки по замыслу перед началом данной работы являлось то, что каждый сайт представляет отдельного автора-экспериментатора и его собственные "компьютеры" - конфигурации оборудования и ПО, на котором проводятся тесты. Всего в тестах участвует 112 процессоров.



33 статьи: 1. Количество процессоров


Тесты выполнены на дефолтных частотах. Частота i7 в статьях указывается равной 2.66 ГГц, однако авторы не упоминают о контроле над работой технологии Turbo Boost - впрочем, возможный разброс производительности в диапазоне 5% не является решающим. Как станет видно ниже, порой наблюдаются большие различия в цифрах в разных статьях, и делать сколь-нибудь надежные выводы удается только лишь благодаря сопоставлению разных результатов.

Чтобы оценить совместно итоги экспериментов из множества статей, производительность конкурсантов оценивается не в абсолютных величинах (FPS), а в процентах относительно базовой величины, за которую принята скорость , развиваемая системами с Phenom (поскольку нам интересно сравнить ее со всеми остальными).

В тех случаях, когда в одной статье присутствует несколько параллельных результатов с Phenom, полученных на разных конфигурациях (в частности, с памятью DDR2 и DDR3) - выбирается только один, наибольший результат.

В случаях, когда в тесте имеется несколько результатов с разными настройками графики, эти результаты усредняются в один. Таким образом, мы учитываем все примененные в тестах игровые разрешения и настройки графики.

Обязательно отсеиваются те результаты, в которых имеется ярко выраженное ограничение по производительности видеокарты (когда настройки графики высокие, и по меньшей мере 3 конфигурации демонстрируют практически одинаковые результаты, пример).

В целом, весовой вклад каждой конфигурации в результаты каждой игры уравнивается, что необходимо для общей, усредненной оценки итогов.

После сбора и отсева результатов, а также усреднения некоторых из них по указанной выше методике, в 33 статьях получено 362 результата из 117 экспериментов в 27 играх, включая синтетические бенчмарки (здесь результат - конкретное значение FPS, эксперимент - тест одного автора в одной игре).

Особую любовь авторы проявили к семейству игр Crysis - что поделаешь, кризис на дворе :) Но выбор вполне обоснованный - Crysis популярен, использует современные технологии, нагружает процессор расчетами физических моделей, имеет встроенный бенчмарк.

Если отбросить синтетические тесты , то на 3 первые игры из 27 - Crysis, Far Cry 2, World in Conflict - приходится больше половины проведенных тестов.



33 статьи: 2. Количество тестов и результатов


33 статьи: 3. Соотношение тестов без синтетики


Итак, сначала отобразим все полученные результаты, сгруппированные по играм, слева направо. На диаграмме - общая картина производительности наших систем.


33 статьи: 4. Все результаты, все значения


Группы точек в левой части диаграммы относятся к синтетическим бенчмаркам (3DMark 05 CPU, 3DMark 06 CPU, 3DMark Vantage CPU, AquaMark 3 CPU). Благодаря стандартным тестам и высокой повторяемости результатов в синтетике, мы наблюдаем 10-процентный разброс значений относительно i7 в двух группах (3DMark 06 CPU, 3DMark Vantage CPU).

10% - это много, вообще-то. По всей видимости, такую погрешность измерений дают нам все неучтенные факторы - обвязка, драйверы, руки тестеров. И это можно считать нашей погрешностью измерений.

Из общей картины тут выбиваются только цифры impulsegamer.com, который в 3DMark Vantage (CPU) смог получить много больше попугаев с Phenom, чем любой другой сайт (13201 против самого высокого соседнего 11261 и среднего 11050); да и в 3DMark 06 результат с Phenom превзошел i7 только у этого сайта. К сожалению, автор не указывает, как ему всё это удалось ;) По-хорошему, после такого промаха эту статью следует исключить из дела, но пока оставим.

В любом случае, поскольку люди не играют в синтетические бенчмарки (в обычном смысле этого слова), дальше мы их учитывать не будем. Отрезаем эти результаты, оставляя только игры:



33 статьи: 5. Без синтетики, значения, оценка


Чтобы дополнить восприятие, рядом расположим другое представление: возьмем среднее арифметическое и стандартное отклонение, чтобы обозначить область, в которой следует ожидать большинство результатов.

А теперь построим распределение результатов с 5% шагом:



33 статьи: 6. Без синтетики, распределение


Как видно, общая картина приближается к тому, что мы могли бы оценить статистически, однако чтобы говорить о настоящей статистике, здесь не хватает ни результатов, ни условий их получения. Поэтому, чтобы не делать больших ошибок, мы ограничимся двумя вещами: созерцанием общей картины и рассмотрением частностей. Этим и займемся.

Аналогичным образом сравним только те игры, в которых сделано хотя бы 3 теста. Таких игр набирается 10 из 27, на них приходится 81% тестов.



33 статьи: 7. 10 игр, значения, оценка


33 статьи: 8. 10 игр, распределение


Общая картина не изменилась. Отметим, что здесь вклад каждой игры в общий результат пропорционален количеству тестов в игре - чем их больше, тем более сильно игра влияет на общую картину.

Далее рассмотрим результаты в отдельных играх, но возьмем только те из них, где сделано не меньше 10 тестов. Их три - Crysis, Far Cry 2 и World in Conflict.



33 статьи: 9. World in Conflict, значения, оценка


В World in Conflict результаты i7 интересным образом расположились в двух довольно компактных группах около 117% и около 135%. Авторы самого высокого результата Phenom (и соответственно, самого низкого i7), сайт driverheaven.net, проводили тестирование на высоких настройках графики. Самые высокие результаты i7 достигнуты на низких разрешениях.



33 статьи: 10. FarCry 2, значения, оценка


FarCry 2 показывает нам, НАСКОЛЬКО разные результаты можно иметь, вроде бы в одной игре, вроде бы на схожих конфигурациях.
5 сайтов показали преимущество i7 в ~28%,
еще 5 - в ~9-15%;
6 сайтов показали отставание i7 в ~9%,
1 сайт - в 21%. Авторы этой цифры на сайте bit-tech.net утверждают, что у них в этой игре всегда такой результат с i7.
Некоторый разброс характеристик можно объяснить разными настройками графики, а также выбором игровых сцен.
Отметим, в этой игре определенно наблюдается превосходство Phenom над i7 при неких условиях.



33 статьи: 11. Crysis, значения, оценка


Выполняя тесты в Crysis, авторы использовали как игровые сцены в "CPU benchmark", отличающиеся повышенной нагрузкой на процессор, так и другими сценами по своему собственному выбору.

Результаты относительно i7 довольно равномерно распределены в диапазоне от 98% до 126%.

Авторы самого высокого результата Phenom (15), сайт modreactor.com, проводили тест на индивидуально выбранной игровой сцене и "очень высоких" настройках графики. С одиночной видеокартой результаты уткнулись в 20FPS, а в режиме CrossFire Phenom дал 33FPS против 24 у i7. Обычно результаты на очень высоких настройках графики отсеиваются как неинтересные, из-за ограничения по видеокарте и одинаковых результатов на разных процессорах. Но это - другой случай. В modreactor.com получили более заметно более высокие результаты Phenom в 3 играх из 5, при высоких настройках графики и CrossFire.

Самые высокие результаты i7 в Crysis (примерно выше 120%) отражают тесты с низкими настройками графики и "очень высоким" "качеством физики". Более низкие цифры отражают результаты в смешанных режимах. Отметим, что такое соотношение справедливо для большинства игр.

На этом можно было бы и закончить, если бы не одно "но". Наравне с другими здесь присутствуют результаты, полученные при излишне низких настройках графики. Они могут быть интересны при бенчмаркинге, но фактически, давно не являются игровыми... Чувство неудовлетворенности подтолкнуло автора проделать работу с цифрами еще раз, чтобы избавиться от таких результатов.


---== Страницы: 1, 2, 3 ==---
Telegram-канал @overclockers_news - это удобный способ следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают