Тестирование процессоров AMD A10-7850К и A8-7600 в программах и играх
реклама
Оглавление
- Вступление
- Проект Mantle
- Тестовые конфигурации
- Инструментарий и методика тестирования 2D
- Уровень потребляемого электричества
- Результаты тестов 2D
- WinRAR 4.2
- Java Micro Benchmark
- Excel BenchMark
- XnView
- Xilisoft Video Converter Ultimate
- Xilisoft Audio Converter Pro
- Pinnacle Studio 16
- Adobe Photoshop CS6 (x64)
- Cinebench (x64)
- Промежуточный итог: 2D
- Инструментарий и методика тестирования 3D
- Результаты тестов 3D
- 3DMark 2011
- Unigine Heaven
- Metro 2033
- Aliens vs Predator 3
- Battlefield III
- Sleeping Dogs
- Sniper Elite V2
- Hitman Absolution
- Far Cry III
- Промежуточный итог: 3D
- Итоговые результаты (2D|3D)
- Заключение
Вступление

Проект разработки APU Kaveri напрашивался сам собой. При наличии в арсенале отличной GPU части компании AMD надо было как можно быстрее интегрировать ее в CPU часть. А для того, чтобы понять, насколько нетривиальной была работа по интеграции объемного графического процессора, расскажу об этом подробнее. Дальнейший рассказ о рождении нового APU и его технологиях следует поделить на две части: первая – официальная, вторая – взгляд с моей точки зрения. Итак, начнем.
реклама
Разработчики компании попытались избежать простого размещения GPU GCN. Ведь в таком случае неизбежно пришлось бы решать более глобальные проблемы масштабируемости пропускной способности шин. Поэтому Kaveri не просто получил более широкие шины обмена данными, он получил их именно в тех местах, где они требовались. Помимо шин, AMD решилась на радикальные изменения в обращении процессора к памяти. Вместо банального массива памяти, деленной на логические части для GPU и CPU, в APU вся память может быть использована обеими частями одновременно.
Называется эта технология hUMA. Проектирование столь сложного алгоритма в первую очередь связано с рядом разработок AMD, направленных на уменьшение издержек очереди CPU и GPU при обращении к памяти. В существующем виде (сильно упрощенном) они работают совместно, но когда возникает потребность в выполнении задачи на GPU, сначала ее получает CPU, потом он резервирует часть памяти и дальше запрос поступает на GPU, который опять блокирует под задачу кусок памяти.
Самое сложное на этом этапе – обмен данными между CPU и GPU. Если нам нужны одновременно данные из процессорного буфера и GPU, то запрос будет ходить через исполнительные устройства, тем самым добавляя циклы как бы пустой работы. С технологией hUMA доступ осуществляется независимо от того, к чему эти области были адресованы. В таком случае уже сейчас можно перечислить ряд достоинств, которыми стали обладать APU:
- Резкое снижение количества данных между CPU-GPU;
- Прямой доступ ко всему адресному пространству памяти;
- Единая адресация памяти на аппаратном уровне;
- Когерентная шина CPU-GPU.
После ряда аппаратных решений наступило время рассказать о программных нововведениях и ближайшем будущем.
Создав организацию HSA, AMD вынуждена решить ряд первостепенных задач. И поскольку уже сейчас в группу входит большое число компаний, то на первое место встала проблема планирования. Скажем, как исполнять код на разных устройствах под разными ОС? Должен быть создан единый алгоритм и система библиотек. Этим AMD придется заниматься в ближайшее время. И готовые программы для конечного потребителя появятся только в конце 2014 года.
Зато благодаря этому AMD получит высокую скорость в таких приложениях за счет того, что код исполняется не только на CPU, но и на GPU одновременно. Фактически вся идея и заключается в том, чтобы программы не видели разницы между ними, используя суммарную производительность.
Проект Mantle

реклама
Рассказ о Mantle был бы неполным без упоминания одного человека – нашего бывшего соотечественника, инициатора всей программы разработки Mantle. Пусть пока его имя останется тайной, но на саммите APU13 мне удалось пообщаться с ним продолжительное время и узнать напрямую из первоисточника цели программы и их воплощение. Официально проект Mantle был запущен с целью улучшения производительности, которой можно было бы достичь, убрав тормозящие места на пути между исполнительными командами и аппаратными решениями AMD. Впоследствии разработчики пришли к неким выводам, после чего добились явного преимущества Mantle над существующими API.
Mantle – это такой же API, как и DirectX, но (проще говоря) более утонченный, в нем учтены архитектурные особенности GPU, поэтому работать он будет быстрее. На мой взгляд, Mantle способен подтолкнуть всю индустрию и доказать, что развлекательная сторона ПК забыта зря. Ее рано снимать со сцены. С другой стороны, AMD нарывается на неприятности со стороны Microsoft, ведь API DirectX был единственным много лет и стал стандартом.
Допустим, вся эпопея с Mantle удалась, а учитывая ее совместимость с видеокартами сторонних производителей, идея может стать действительно удачной. Что же такое DirectX для Microsoft? Сейчас мы возьмем и рассмотрим Dx11(Х): скелет этого API не меняется с седьмой версии, добавляются лишь незначительные команды, фактически все еще используется базис седьмого DX, что немного пугает. Тогда почему Microsoft не хочет что-либо менять? Ответов может быть много, и, скорее всего, все они будут являться правдой.
Начнем с вершины: DX для Microsoft – продукт не стратегический. После того, как Microsoft Entertainment отделилась от основной компании Microsoft, приставочный мир стал жить отдельно от ПК. Dx11 хоть и стал основным API новых приставок, дополнительные функции в нем являются результатом «впиливания», а не разработки. К тому же «хвост» старых команд никуда не делся, а так и тянется от поколения к поколению. Для самой Windows DX не является условием выживания ОС на рынке – это бонус, не более того.
Вот и получается, что DX, на который Microsoft «подсадила» всех разработчиков, перестал их же удовлетворять. Код программ с каждым новым поколением видеокарт растет, а скорость выполнения падает. Глава разработчиков API Mantle понимал, что создание альтернативного API вызовет негодование со стороны Microsoft. Здесь напомню, что AMD на ближайшие несколько лет будет являться партнером для Microsoft, поскольку производит процессоры для Xbox One. С другой стороны, те ключевые студии типа DICE и Oxygen, применив Mantle, были в восторге. Да-да, удалось поговорить и с разработчиками. Наибольшие дивиденды получат конечные пользователи, у них появится альтернатива.
Но остается вопрос, чем же так хорош Mantle?

Главной проблемой DX стала перегрузка CPU запросами от программ. Чем больше юнитов используется в коде, тем быстрее вырастает очередь из запросов. Ну, очередь и очередь, скажете вы, чем она мешает? Дело в том, что исполнение кода на GPU не обходится без участия CPU. Сначала он обрабатывает часть требуемых данных и только потом в действие вступает GPU. На определенном этапе, особенно в стратегиях, API DX так сильно тормозил, что GPU «отдыхал» чуть ли не половину времени. Конечно, программисты пытались разными путями обойти порог, но настало время, когда вместо очередных попыток проще было создать новый API, без узких мест. Кстати, в команде разработчиков со стороны AMD есть несколько ключевых людей, которые по собственному опыту могут понять запросы разработчиков игр. Поэтому, по их мнению, они учли все подводные камни в новом API.
Уже сейчас доступен драйвер и обновлена игра Battlefield, но, тем не менее, выводы делать все же рано. Нужно смотреть шире и попробовать сравнить DX с Mantle в той среде, где DX по-настоящему сдерживал производительность. Так что стоит подождать стратегий с поддержкой Mantle. А пока новый API добавит несколько процентов скорости в любимой Battlefield. Наибольший эффект ждет нас в несбалансированных конфигурациях, где перевес останется на стороне GPU. И предварительно можно сказать, что Mantle будет интересен в первую очередь владельцам средних по мощности систем.
От себя могу добавить, что AMD с Mantle действительно может при благоприятном стечении обстоятельств обойти Microsoft и переписать историю развития рынка развлечений. Остается лишь понять, хватит ли сил AMD. Подробное тестирование Mantle мы отложим на недельку, пока не улягутся страсти и не приедут видеокарты для Dual Graphics.

Вернемся к испытуемым – вместе с APU A10-7850К нам достался инженерный образец A8-7600. С ними и состоится знакомство.
Тестовые конфигурации
Тестовый стенд №1
- Материнская плата: MSI Z77A-GD65 (Intel Z77, LGA 1155);
- Система охлаждения: система водяного охлаждения;
- Термоинтерфейс: Arctic Cooling МХ-2;
- Оперативная память: GEIL EvoVeloce DDR3 1600 МГц, 2 модуля x 8 Гбайт, (7-8-8-20-1T, 1.65 В);
- Жесткие диски:
- Crucial M4 (CT128M4SSD2), 128 Гбайт;
- WD Caviar Green WD10EADS, 1 Тбайт;
- Блок питания: Enermax MAXREVO 1250 Ватт;
- Аудиокарта: ASUS Xonar HDAV 1.3;
- Операционная система: Microsoft Windows 7 x64 SP1.
Процессоры и режимы их работы в системе №1
- Core i7-3770K 3.5 ГГц, Turbo Boost до 3.9 ГГц, число ядер 4, число потоков 8;
- Core i5-3570K 3.4 ГГц, Turbo Boost до 3.8 ГГц, число ядер 4, число потоков 4;
- Core i5-3470 3.2 ГГц, Turbo Boost до 3.6 ГГц, число ядер 4, число потоков 4;
- Core i3-3225/3220 3.3 ГГц, Turbo Boost нет, число ядер 2, число потоков 4;
- Core i7-2700K 3.5 ГГц, Turbo Boost до 3.9 ГГц, число ядер 4, число потоков 8;
- Core i5-2500 3.3 ГГц, Turbo Boost до 3.7 ГГц, число ядер 4, число потоков 4;
- Core i3-2125 3.3 ГГц, Turbo Boost нет, число ядер 2, число потоков 2;
- Pentium G640 2.8 ГГц, Turbo Boost нет, число ядер 2, число потоков 4;
- Core i7-3770K@ 4.7 ГГц, 47x100 МГц, число ядер 4, число потоков 8;
- Core i5-3570K@4.6 ГГц, 46x100 МГц, число ядер 4, число потоков 4;
- Core i5-3470@ 3.9-4.1 ГГц, 39-41 х 100 МГц, число ядер 4, число потоков 4;
- Core i7-2700K@ 4.7 ГГц, 47 x 100 МГц, число ядер 4, число потоков 8;
- Core i5-2500@ 3.9-4.1 ГГц, 39-41 х 100 МГц, число ядер 4, число потоков 4.
реклама
Тестовый стенд №2
- Материнская плата: MSI A75MA-G55 (AMD Hudson D3, FM1);
- Система охлаждения: система водяного охлаждения;
- Термоинтерфейс: Arctic Cooling МХ-2;
- Оперативная память: GEIL EvoVeloce DDR3 1600 МГц, 2 модуля x 8 Гбайт, (7-8-8-20-1T, 1.65 В);
- Жесткие диски:
- Crucial M4 (CT128M4SSD2), 128 Гбайт;
- WD Caviar Green WD10EADS, 1 Тбайт;
- Блок питания: Enermax MAXREVO 1250 Ватт;
- Аудиокарта: ASUS Xonar HDAV 1.3;
- Операционная система: Microsoft Windows 7 x64 SP1.
Процессоры и режимы их работы в системе №2
- А8-3870К 3.0 ГГц, число ядер 4, число потоков 4;
- A6-3670К 2.7 ГГц, число ядер 4, число потоков 4;
- A6-3650 2.6 ГГц, число ядер 4, число потоков 4;
- A6-3500 2.1 ГГц, Turbo Boost до 2.4 ГГц, число ядер 3, число потоков 3;
- A4-3400 2.7 ГГц, число ядер 2, число потоков 2;
- A4-3300 2.5 ГГц, число ядер 2, число потоков 2;
- А8-3870К@ 3.7 ГГц, 37 x 100 МГц, число ядер 4, число потоков 4;
- A6-3670К@ 3.5 ГГц, 35 x 100 МГц, число ядер 4, число потоков 4;
- A6-3650@ 2.9 ГГц, 26 x 112.5 МГц, число ядер 4, число потоков 4;
- A6-3500@ 2.7 ГГц, 24 x 112.5 МГц, число ядер 3, число потоков 3;
- A4-3400@ 3.0 ГГц, 27 x 112.5 МГц, число ядер 2, число потоков 2;
- A4-3300@ 2.8 ГГц, 25 x 112.5 МГц, число ядер 2, число потоков 2.
Тестовый стенд №3
- Материнская плата: FM2-A85XA-G65 (AMD A85X, FM2);
- Система охлаждения: система водяного охлаждения;
- Термоинтерфейс: Arctic Cooling МХ-2;
- Оперативная память: GEIL EvoVeloce DDR3 1600 МГц, 2 модуля x 8 Гбайт, (7-8-8-20-1T, 1.65 В);
- Жесткие диски:
- Crucial M4 (CT128M4SSD2), 128 Гбайт;
- WD Caviar Green WD10EADS, 1 Тбайт;
- Блок питания: Enermax MAXREVO 1250 Ватт;
- Аудиокарта: ASUS Xonar HDAV 1.3;
- Операционная система: Microsoft Windows 7 x64 SP1.
Процессоры и режимы их работы в системе №3
- A10-6800K 4.1 ГГц, Turbo Boost до 4.4 ГГц, число ядер 4, число потоков 4;
- A10-5800K 3.8 ГГц, Turbo Boost до 4.2 ГГц, число ядер 4, число потоков 4;
- A10-5700 3.4 ГГц, Turbo Boost до 4.0 ГГц, число ядер 4, число потоков 4;
- A8-5600K 3.6 ГГц, Turbo Boost до 3.9 ГГц, число ядер 4, число потоков 4;
- A8-5500 3.2 ГГц, Turbo Boost до 3.7 ГГц, число ядер 4, число потоков 4;
- A6-5400K 3.6 ГГц, Turbo Boost до 3.8 ГГц, число ядер 2, число потоков 2;
- A4-5300 3.4 ГГц, Turbo Boost до 3.6 ГГц, число ядер 2, число потоков 2;
- A10-6800K@ 4.8 ГГц, 48 х 100 МГц, число ядер 4, число потоков 4;
- A10-5800K@ 4.4 ГГц, 42 х 105 МГц, число ядер 4, число потоков 4;
- A8-5600K@ 4.3 ГГц, 39 х 110 МГц, число ядер 4, число потоков 4;
- A8-5500@ 4.0 ГГц, 37 х 108.5 МГц, число ядер 4, число потоков 4;
- A6-5400K@ 4.5 ГГц, 38 х 118.5 МГц, число ядер 2, число потоков 2;
- А4-5300@ 4.1 ГГц, 36 х 114 МГц, число ядер 2, число потоков 2.
Тестовый стенд №4
- Материнская плата: ASUS Z87-Deluxe (Intel Z87, LGA 1150);
- Система охлаждения: система водяного охлаждения;
- Термоинтерфейс: Arctic Cooling МХ-2;
- Оперативная память: GEIL EvoVeloce DDR3 1600 МГц, 2 модуля x 8 Гбайт, (7-8-8-20-1T, 1.65 В);
- Жесткие диски:
- Crucial M4 (CT128M4SSD2), 128 Гбайт;
- WD Caviar Green WD10EADS, 1 Тбайт;
- Блок питания: Enermax MAXREVO 1250 Ватт;
- Аудиокарта: ASUS Xonar HDAV 1.3;
- Операционная система: Microsoft Windows 7 x64 SP1.
Процессоры и режимы их работы в системе №4
- Core i7-4770K 3.5 ГГц, Turbo Boost до 3.9 ГГц, число ядер 4, число потоков 8;
- Core i5-4670K 3.4 ГГц, Turbo Boost до 3.8 ГГц, число ядер 4, число потоков 4;
- Core i7-4770K@ 4.3 ГГц, 43 x 100 МГц, число ядер 4, число потоков 8.
Тестовый стенд №5
- Материнская плата: FM2-A85XA-G65 (AMD A85X, FM2);
- Система охлаждения: система водяного охлаждения;
- Термоинтерфейс: Arctic Cooling МХ-2;
- Оперативная память: GEIL EvoVeloce DDR3 1600 МГц, 2 модуля x 8 Гбайт, (7-8-8-20-1T, 1.65 В);
- Жесткие диски:
- Crucial M4 (CT128M4SSD2), 128 Гбайт;
- WD Caviar Green WD10EADS, 1 Тбайт;
- Блок питания: Enermax MAXREVO 1250 Ватт;
- Аудиокарта: ASUS Xonar HDAV 1.3;
- Операционная система: Microsoft Windows 7 x64 SP1.
Процессоры и режимы их работы в системе №5
- A10-7850K 3.7 ГГц, Turbo Boost до 4.0 ГГц, число ядер 4, число потоков 4;
- A8-7600K 3.3 ГГц, Turbo Boost до 3.8 ГГц, число ядер 4, число потоков 4;
- A10-7850K@ 4.4 ГГц, 44 х 100 МГц, число ядер 4, число потоков 4;
- A8-7600@ 3.9 ГГц, 37 х 105 МГц, число ядер 4, число потоков 4.
Инструментарий и методика тестирования 2D
Уровень энергопотребления измеряется по трем величинам.
- Первая, в момент простоя: все энергосберегающие функции материнской платы (а не процессора) отключены.
- Вторая: 100% нагрузка CPU осуществляется за счет запуска Prime x64
- Третья: 100% загрузка CPU+GPU – в дополнение к Prime x64 появляется EVGA OC Scanner X.
Стоит немного рассказать о применяемых в тестировании программах и причинах их выбора.
WinRAR 4.2 x64 – используется встроенный тест производительности. Сама программа размещена на разделе диска, который находится на SSD накопителе, тем самым исключается низкая производительность классического HDD. Результат теста – это среднее значение, полученное после трех запусков программы. WinRAR неспроста фигурирует в данном обзоре, ведь нам часто приходится скачивать и распаковывать файлы. Тем более RAR очень распространен среди архиваторов и хорошо поддерживает многопоточность.
Java Micro Benchmark . Нетипичный тест среди обзоров процессоров. Java Micro Benchmark позволяет сравнить показатели производительности системы на различных платформах.
Excel BenchMark еще более редкий гость. Изначально стояла задача проверить скорость работы в пакете Office. Хорошо подходит конвертация из Word в PDF, но есть слишком сильная зависимость от остальной конфигурации системы, особенно HDD. А рост производительности чаще выше от смены частоты оперативной памяти, чем от дополнительных 100-200 МГц частоты процессора. Поэтому пришлось поискать более адекватный тест, который нагружает связку «процессор-память-чипсет». К счастью, он нашелся. Итак, что же представляет собой тест Excel? Изначально это таблица с данными, по которым в процессе выполнения бенчмарка строится динамично меняющийся график.
Всего в группе шесть подтестов.
- Первый – создает пять колонок * 65 535 строк со случайными данными.
- Второй – отображает время, необходимое для расчета индикатора по пяти колонкам из 65 535 строк данных, созданных в первом тесте.
- Третий – показывает скорость отображения изменения цен за 30 секунд.
- Четвертый – 63 000 значений с измененными ценами преобразуются в OHLC данные.
- Пятый – тест с применением нескольких условий (ждать, пока не сформируются все значения изменения цен) и формул для расчета. В итоге можно видеть результат количества изменений цен, которые могут быть завершены с формулой перерасчета в течение 30 секунд.
- Шестой – этот тест является идентичным пятому, за исключением того, что все формулы одновременно зависят от изменения в клетке, E5000.
XnView достаточно распространенная программа для просмотра фотоматериала. Она бесплатна и легка в использовании. Дополнительно в нее встроены простые функции для переконвертирования форматов, внесения изменений и прочего. Меня интересовал бытовой взгляд на тест, точнее, за какое время программа внесет изменения и сохранит тридцать пять файлов NEF формата. Типичные требования любителя-фотографа. Но задача усложняется не просто сменой формата в JPG, но и требованием сделать изменения в графических файлах. Были выбраны самые простые и очевидные вещи: изменение баланса цвета, смена температуры, выравнивание горизонта, убирание выпуклости, добавление резкости, изменение размера до 1900 пикселей по большей стороне. Не скажу, что в процессе тестирования задействуются все ресурсы, но от скорости ЦП результат зависит на 85%. На оставшиеся 15% влияет жесткий диск.
Xilisoft Video Converter Ultimate – популярный видеоконвертер. Причина его выбора в том, что он умеет хорошо загружать процессор, используя его возможности на 100%. Из всего списка возможностей мой выбор пал на 20-минутный видеофайл с одной серией сериала в формате MKV 720p, а на выходе должен получиться удобный файл для просмотра на планшете. Задача, распространенная среди владельцев планшетов, которые покупают все больше и больше пользователей. Конечно, с годами растет число ядер CPU и мощность GPU, но до сих пор не все экземпляры могут воспроизводить неконвертированное видео.
Xilisoft Audio Converter Pro. Конвертируем альбом исполнителя из FLAC в MP3, пригодный для использования в телефонах, планшетах и плеерах. FLAC файл однообразен и наполнен всеми песнями последовательно, нам надо разбить его на композиции и сохранить каждую в MP3. Простое действие для пользователя, но непростое для системы. Проблема в том, что большая часть конвертеров аудио не загружает все ядра, то есть они являются однопоточными заданиями. Увы, мне так и не удалось найти подходящую программу, адекватно нагружающую CPU, зато интересно будет проверить, как работают технологии ускорения одного ядра на процессорах разных компаний.
Pinnacle Studio 16. Версия известнейшей платформы для обработки видеоматериалов. Теоретически во время финальной сборки видеоматериала программа использует все технологии процессора, но самое главное – она многопоточная! Сама программа является очень распространенной среди любительских монтажных систем, а нам многого и не надо. Было решено соединить воедино несколько фрагментов с экшен камеры в один, снабдить их плавными переходами и привести к одной температуре картинку, равно как и цветовой баланс, и резкость.
Adobe Photoshop CS6 (64 Bit). Много слов здесь ни к чему. Результат тестирования – это время наложения фильтров на одну картинку. Для тестирования был взят обыкновенный JPG файл средних размеров, который был пропущен через фильтры, изменение размеров, настройки гаммы и прочее. Вполне типичный набор для программы. В отличие от видеокодирования Photoshop так и не стал многопоточным, скорее его можно назвать умеренно загружающей ядра процессора программой.
Cinebench x64. Распространенный тест процессора в рендере. Изначально мне бы хотелось предоставить результаты в пакетах Autodesk 2013, но из-за жесткой привязки к конфигурации системы при смене процессора требуется новая регистрация продукта. И даже после перерегистрации пакет не работает должным образом, как итог, пришлось от него отказаться. Результаты одной системы с разными процессорами в Autodesk были сравнены с разницей по результатам тестирования Cinebench, существенного отличия не выявилось.
реклама
Страницы материала
Теги
Лента материалов раздела
Интересные материалы
Возможно вас заинтересует
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии 174 Правила