33 статьи: играем с Phenom (1 из 3)
реклама
33 СТАТЬИ: ИГРАЕМ С PHENOM
В этой работе представлены сводные данные о производительности AMD Phenom II X4 955 (BE) и Intel Core i7 в играх, составленные по статьям-обзорам этих процессоров. Для сравнения учитываются Q9400, Q9450, Q9550, Q9650. Процессор AMD интересен автору как самый молодой и неизвестный.
На просторах интернета было найдено более 40 тестов с участием нужного Phenom; из их числа, после отсева дубликатов отобрано 33 статьи с обязательным участием двух главных соперников (список статей приведен в третьей части). Их авторы проявляют солидарность в выборе двух главных конкурентов.
Наиболее важным аспектом такой сводной оценки по замыслу перед началом данной работы являлось то, что каждый сайт представляет отдельного автора-экспериментатора и его собственные "компьютеры" - конфигурации оборудования и ПО, на котором проводятся тесты. Всего в тестах участвует 112 процессоров.
33 статьи: 1. Количество процессоров
Тесты выполнены на дефолтных частотах. Частота i7 в статьях указывается равной 2.66 ГГц, однако авторы не упоминают о контроле над работой технологии Turbo Boost - впрочем, возможный разброс производительности в диапазоне 5% не является решающим. Как станет видно ниже, порой наблюдаются большие различия в цифрах в разных статьях, и делать сколь-нибудь надежные выводы удается только лишь благодаря сопоставлению разных результатов.
Чтобы оценить совместно итоги экспериментов из множества статей, производительность конкурсантов оценивается не в абсолютных величинах (FPS), а в процентах относительно базовой величины, за которую принята скорость , развиваемая системами с Phenom (поскольку нам интересно сравнить ее со всеми остальными).
В тех случаях, когда в одной статье присутствует несколько параллельных результатов с Phenom, полученных на разных конфигурациях (в частности, с памятью DDR2 и DDR3) - выбирается только один, наибольший результат.
В случаях, когда в тесте имеется несколько результатов с разными настройками графики, эти результаты усредняются в один. Таким образом, мы учитываем все примененные в тестах игровые разрешения и настройки графики.
Обязательно отсеиваются те результаты, в которых имеется ярко выраженное ограничение по производительности видеокарты (когда настройки графики высокие, и по меньшей мере 3 конфигурации демонстрируют практически одинаковые результаты, пример).
В целом, весовой вклад каждой конфигурации в результаты каждой игры уравнивается, что необходимо для общей, усредненной оценки итогов.
После сбора и отсева результатов, а также усреднения некоторых из них по указанной выше методике, в 33 статьях получено 362 результата из 117 экспериментов в 27 играх, включая синтетические бенчмарки (здесь результат - конкретное значение FPS, эксперимент - тест одного автора в одной игре).
Особую любовь авторы проявили к семейству игр Crysis - что поделаешь, кризис на дворе :) Но выбор вполне обоснованный - Crysis популярен, использует современные технологии, нагружает процессор расчетами физических моделей, имеет встроенный бенчмарк.
Если отбросить синтетические тесты , то на 3 первые игры из 27 - Crysis, Far Cry 2, World in Conflict - приходится больше половины проведенных тестов.
33 статьи: 2. Количество тестов и результатов
33 статьи: 3. Соотношение тестов без синтетики
Итак, сначала отобразим все полученные результаты, сгруппированные по играм, слева направо. На диаграмме - общая картина производительности наших систем.
33 статьи: 4. Все результаты, все значения
Группы точек в левой части диаграммы относятся к синтетическим бенчмаркам (3DMark 05 CPU, 3DMark 06 CPU, 3DMark Vantage CPU, AquaMark 3 CPU). Благодаря стандартным тестам и высокой повторяемости результатов в синтетике, мы наблюдаем 10-процентный разброс значений относительно i7 в двух группах (3DMark 06 CPU, 3DMark Vantage CPU).
10% - это много, вообще-то. По всей видимости, такую погрешность измерений дают нам все неучтенные факторы - обвязка, драйверы, руки тестеров. И это можно считать нашей погрешностью измерений.
Из общей картины тут выбиваются только цифры impulsegamer.com, который в 3DMark Vantage (CPU) смог получить много больше попугаев с Phenom, чем любой другой сайт (13201 против самого высокого соседнего 11261 и среднего 11050); да и в 3DMark 06 результат с Phenom превзошел i7 только у этого сайта. К сожалению, автор не указывает, как ему всё это удалось ;) По-хорошему, после такого промаха эту статью следует исключить из дела, но пока оставим.
В любом случае, поскольку люди не играют в синтетические бенчмарки (в обычном смысле этого слова), дальше мы их учитывать не будем. Отрезаем эти результаты, оставляя только игры:
33 статьи: 5. Без синтетики, значения, оценка
Чтобы дополнить восприятие, рядом расположим другое представление: возьмем среднее арифметическое и стандартное отклонение, чтобы обозначить область, в которой следует ожидать большинство результатов.
А теперь построим распределение результатов с 5% шагом:
33 статьи: 6. Без синтетики, распределение
Как видно, общая картина приближается к тому, что мы могли бы оценить статистически, однако чтобы говорить о настоящей статистике, здесь не хватает ни результатов, ни условий их получения. Поэтому, чтобы не делать больших ошибок, мы ограничимся двумя вещами: созерцанием общей картины и рассмотрением частностей. Этим и займемся.
Аналогичным образом сравним только те игры, в которых сделано хотя бы 3 теста. Таких игр набирается 10 из 27, на них приходится 81% тестов.
33 статьи: 7. 10 игр, значения, оценка
33 статьи: 8. 10 игр, распределение
Общая картина не изменилась. Отметим, что здесь вклад каждой игры в общий результат пропорционален количеству тестов в игре - чем их больше, тем более сильно игра влияет на общую картину.
Далее рассмотрим результаты в отдельных играх, но возьмем только те из них, где сделано не меньше 10 тестов. Их три - Crysis, Far Cry 2 и World in Conflict.
33 статьи: 9. World in Conflict, значения, оценка
В World in Conflict результаты i7 интересным образом расположились в двух довольно компактных группах около 117% и около 135%. Авторы самого высокого результата Phenom (и соответственно, самого низкого i7), сайт driverheaven.net, проводили тестирование на высоких настройках графики. Самые высокие результаты i7 достигнуты на низких разрешениях.
33 статьи: 10. FarCry 2, значения, оценка
FarCry 2 показывает нам, НАСКОЛЬКО разные результаты можно иметь, вроде бы в одной игре, вроде бы на схожих конфигурациях.
5 сайтов показали преимущество i7 в ~28%,
еще 5 - в ~9-15%;
6 сайтов показали отставание i7 в ~9%,
1 сайт - в 21%. Авторы этой цифры на сайте bit-tech.net утверждают, что у них в этой игре всегда такой результат с i7.
Некоторый разброс характеристик можно объяснить разными настройками графики, а также выбором игровых сцен.
Отметим, в этой игре определенно наблюдается превосходство Phenom над i7 при неких условиях.
33 статьи: 11. Crysis, значения, оценка
Выполняя тесты в Crysis, авторы использовали как игровые сцены в "CPU benchmark", отличающиеся повышенной нагрузкой на процессор, так и другими сценами по своему собственному выбору.
Результаты относительно i7 довольно равномерно распределены в диапазоне от 98% до 126%.
Авторы самого высокого результата Phenom (15), сайт modreactor.com, проводили тест на индивидуально выбранной игровой сцене и "очень высоких" настройках графики. С одиночной видеокартой результаты уткнулись в 20FPS, а в режиме CrossFire Phenom дал 33FPS против 24 у i7. Обычно результаты на очень высоких настройках графики отсеиваются как неинтересные, из-за ограничения по видеокарте и одинаковых результатов на разных процессорах. Но это - другой случай. В modreactor.com получили более заметно более высокие результаты Phenom в 3 играх из 5, при высоких настройках графики и CrossFire.
Самые высокие результаты i7 в Crysis (примерно выше 120%) отражают тесты с низкими настройками графики и "очень высоким" "качеством физики". Более низкие цифры отражают результаты в смешанных режимах. Отметим, что такое соотношение справедливо для большинства игр.
На этом можно было бы и закончить, если бы не одно "но". Наравне с другими здесь присутствуют результаты, полученные при излишне низких настройках графики. Они могут быть интересны при бенчмаркинге, но фактически, давно не являются игровыми... Чувство неудовлетворенности подтолкнуло автора проделать работу с цифрами еще раз, чтобы избавиться от таких результатов.
реклама
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Сейчас обсуждают