Изучение работы встроенной графики AMD Kaveri на примере A10-7850K

Поиск программного обеспечения, наиболее подходящего в качестве теста стабильности системы для разгона встроенной графики, проверка частотного потенциала графического ядра и оперативной памяти. Изучение влияния частот встроенной графики и ЦП на производительность системы, сравнение нескольких режимов работы памяти и оценка уровня прироста производительности при комплексном разгоне APU.
10 сентября 2014, среда 00:00
Ivan_FCB для раздела Лаборатория

Оглавление

Вступление

В предыдущих материалах, посвященных изучению нюансов разгона и влиянию разгона на производительность системы, основное внимание уделялось процессорной части Kaveri. Изучение работы встроенной графики было отложено «на потом».

Это «потом» настало, и пришло время выяснить возможности разгона встроенной графики Kaveri, а также оценить влияние ее разгона на производительность системы.

Тестовый стенд и ПО

Тестирование проводилось в составе следующей конфигурации:

  • Материнская плата: ASUS A88X-PRO;
  • Процессор: AMD A10-7850K;
  • Система охлаждения: Thermalright Silver Arrow SB-E Extreme;
  • Термоинтерфейс: Prolimatech PK-1;
  • Оперативная память: G.Skill TridentX F3-2400C10D-8GTX, 2*4 Гбайта DDR3-2400 (10-12-12-31, 1.65 В);
  • Жесткий диск: Western Digital Caviar Blue (WD500AAKS), 500 Гбайт;
  • Блок питания: Corsair CMPSU-750HX, 750 Ватт;
  • Корпус: открытый стенд.

Программное обеспечение

  • Операционная система: Windows 7 Ultimate SP1 x64;
  • Используемый драйвер встроенной графики: AMD Catalyst 14.7-rc3-windows-aug12;
  • Дополнительное ПО:
    • FRAPS 3.5.99, build 15618;
    • AutoHotkey 1.0.48.05.

Разгон встроенной графики

Поиск ПО для выявления нестабильности GPU

В данном подразделе статьи выберем программное обеспечение, при помощи которого легче выявить нестабильность встроенной графики при заведомо стабильных частотах процессора, памяти и CPU_NB.

Методика относительно проста: при фиксированном значении напряжения питания подобрать максимальный разгон для каждой из программ, и вычислить тест, при котором будет достигнута минимальная частота стабильной работы. Все тесты проводились при штатном напряжении встроенной графики, то есть при CPU_NB 1.1375 В.

В список для проверки попали приложения, которые впоследствии использовались для оценки производительности, а также пара последних версий 3DMark, стресс-тесты OCCT 4.4.0 и FurMark 1.13.0.0. Частота работы встроенной графики, при которой стартует Windows – 960 МГц.

Таблица с итоговыми результатами разгона в зависимости от используемого ПО:

Тест Итоговый результат разгона встроенной графики, МГц
OCCT 4.4.0 DX9 800
OCCT 4.4.0 DX11 800
FurMark 1.13.0.0 800
3DMark 11 Performance 800
3DMark Cloud Gate 800
3DMark Fire Strike 800
HWBOT Unigine Heaven Benchmark 757
Crysis 3 800
F1 2013 800
Hitman: Absolution 800
Far Cry 3 757
Sleeping Dogs 800
Metro: Last Light 800
The Elder Scrolls V: Skyrim 757
World of Tanks 0.9.2 800

Все тесты расположились максимально плотной группой, лишь три теста из пятнадцати не были пройдены при частоте работы встроенной графики 800 МГц. При этом проблемы в них проявлялись не сразу, а ближе к завершению тестов, то есть система находилась на грани стабильности.

Для более простого упорядочения программ по возможностям поиска нестабильности был проведен повторный тест на минимальное напряжение для достижения стабильной работы при частоте 800 МГц.

Тест Минимальное напряжение
для 800 МГц, В*
OCCT 4.4.0 DX9 1.1
OCCT 4.4.0 DX11 1.125
FurMark 1.13.0.0 1.1125
3DMark 11 Performance 1.1125
3DMark Cloud Gate 1.1125
3DMark Fire Strike 1.1125
HWBOT Unigine Heaven Benchmark 1.14375
Crysis 3 1.1125
F1 2013 1.1375
Hitman: Absolution 1.1325
Far Cry 3 1.14375
Sleeping Dogs 1.1375
Metro: Last Light 1.125
The Elder Scrolls V: Skyrim 1.14375
World of Tanks 0.9.2 1.1375
*Минимальное напряжение, требуемое для стабильной работы при частоте встроенной графики 800 МГц.

Тесты вновь расположились плотной группой, что говорит об отсутствии принципиальной разницы в выборе программ для определения стабильности. Очевидно, встроенную графику лучше тестировать не одним-единственным приложением.

Из интересного отмечу, что не блеснули синтетические стресс-тесты, видимо, причиной таких результатов является реализованная в драйверах защита. По крайней мере, в OCCT на первых секундах теста достигается пик производительности (и, как показывают замеры – пик энергопотребления), после чего производительность падает до «крейсерской» спустя несколько секунд. Скорее всего, именно поэтому (в отличие от тестирования процессоров Richland и Trinity) синтетические тесты на фоне игровой нагрузки выглядят блекло.

Разгон встроенной графики

Перед тем, как приступить непосредственно к разгону встроенной графики, стоит предварительно остановиться на том, какие настройки позволяет выставить система, и какие точки отсчета есть в распоряжении пользователя. Если при разгоне ЦП можно оперировать изменением базовой частоты и коэффициента умножения CPU, получая результирующую частоту работы, то при разгоне встроенной графики в UEFI меню материнской платы предлагается сразу выбрать результирующую частоту работы.

Если не считать режимов «даунклокинга», доступны следующие значения частот: 720 МГц (штатный режим), 757 МГц, 800 МГц, 847 МГц, 900 МГц, 960 МГц, 1028 МГц, 1107 МГц, 1200 МГц, 1309 МГц, 1440 МГц, 1600 МГц, 1800 МГц. Отмечу, что, несмотря на другое представление информации, это такой же перечень коэффициентов умножения, ибо при изменении базовой частоты пропорционально меняется и частота работы встроенной графики.

Поскольку шаг изменения частот переменный, то в данном случае при разгоне системы проще пойти от обратного, на каждом шаге частоты подбирая требуемое для стабильной работы напряжение питания, нежели подбирая под выставленное напряжение значения стабильных частот. При условии возможности управления напряжением с низким шагом так выйдет точнее.

В качестве точки отсчета для начала разгона был взят режим 800 МГц / 1.14375 В, как найденный в процессе поиска ПО для выявления нестабильности. В качестве теста на стабильность разгона был выбран HWBOT Unigine Heaven Benchmark, как наиболее удобный для этих целей.

В итоге при «переборе» шагов установки частоты был получен следующий график разгона:

В целом, реакцию встроенного графического процессора на увеличение напряжения питания можно охарактеризовать как неплохую, она сохраняется даже при увеличении напряжения более чем на 20%.

Следующий шаг частоты – внушительные 1107 МГц, и системе такой результат разгона не покорился. Да и если экстраполировать результаты линии графика до точки 1107 МГц, получается требуемый уровень напряжения 1.5 В+, что для процессора уже весьма и весьма небезопасно.

Но не останавливаться же на достигнутом, так что для более точного поиска частотного потенциала встроенной графики пришлось прибегнуть к разгону базовой частоты. При увеличении базовой частоты с шагом в 2 МГц были получены две дополнительные точки графика – 1049 МГц и 1070 МГц. Итого, график разгона приобрел следующий вид:

Можно отметить, что даже при таких высоких напряжениях, как 1.45 В (+27.5% к штатному значению!), у процессора все еще оставался небольшой потенциал разгона. Но подобные режимы небезопасны, тем более что надо оставить немного запаса по температурному режиму, дабы сохранить возможность одновременного разгона не только встроенной графики, но и ЦП.

Подводя итоги, можно отметить, что в разгоне встроенной графики процессор неплох, особенно с учетом того, что штатная частота работы встроенной графики составляет 720 МГц. Итого, есть 48% прироста частоты.

Разгон оперативной памяти

Еще во время предыдущего тестирования A10-7850K, посвященного влиянию разгона на производительность, было отмечено, что у процессора (по крайней мере, у конкретного экземпляра) откровенно слабый контроллер памяти, и даже режим DDR3-2133 работал с перебоями.

Переход от внешнего графического адаптера к встроенной графике явно не прибавил контроллеру памяти «прыти», а ведь (как показали исследования работы APU Trinity и Richland) именно память вносит основной вклад в результаты производительности. Как следствие, поиску максимальной стабильной частоты работы памяти надо уделить максимальное внимание, работая буквально «на грани».

Хорошо то, что материнская плата помимо увеличения базовой частоты способна работать и на частотах ниже штатных 100 МГц, то есть для множителя DDR3-2133 можно поискать стабильность снижением базовой частоты, а не получать режим DDR3-1866*BCLK 106. При использовании CPU NB 1.45 В удалось стабилизировать систему при работе на базовой частоте 97 МГц, что дало частоту работы памяти 2069 МГц.

Отдельно отмечу, что со снижением базовой частоты снижается и частота работы встроенной графики, что позволило выставить режим 1107 МГц (результирующая частота работы встроенной графики составила 1074 МГц), и добиться от системы стабильности.

Аспекты разгона процессора

По сравнению с просто разгоном процессора, при работе встроенной графики появляется дополнительный источник нагрева, а взаимный подогрев блоками друг друга может привести к «качелям» между разгоном ЦП и графики.

Так как процессорозависимости в тестах производительности ждать особо не приходится, было решено проверить, как при неизменном разгоне встроенной графики до 1070 МГц с CPU NB 1.45 В система отреагирует на увеличение напряжения питания процессора, и на сколько его можно безболезненно поднять. Стресс-тесты были отброшены, ибо в них встроенная графика может уйти (и уйдет) в защиту, искажая результаты, поэтому для тестирования было решено остановиться на одной из игр. Как наиболее удобная с точки зрения процесса тестирования, была выбрана игра Hitman: Absolution.

При штатном напряжении питания APU энергопотребление с максимально разогнанной встроенной графикой составило 107 Вт, при увеличении напряжения питания процессора до 1.45 В его энергопотребление в игре выросло до 128 Вт, стабильность же пропала при напряжении питания 1.4875 В, с энергопотреблением 142 Вт. Замер энергопотребления проводился при помощи мультиметра Mastech MY64 и 50 А 75 мВ шунта (75ШИП1-50-0.5) в разрыве плюса 8-pin кабеля питания.

Как следствие, не влияя на встроенную графику, можно разгонять ЦП приблизительно до 1.47 В, что (опираясь на результаты материала по исследованию разгона процессорной части) позволяет ориентироваться на диапазон частот между 4400 МГц и 4500 МГц. С учетом доступных режимов разгона встроенной графики и оперативной памяти получилось достичь стабильности при установке коэффициентов умножения 43 для базовой частоты 104 МГц и 46 для базовой частоты 97 МГц.

Для дальнейших экспериментов было получено два «на грани» стабильных результата, которые отражают весь частотный потенциал процессора при комплексном разгоне.

Изучение влияния разгона на производительность

Методика тестирования

Условно проверку влияния разгона на производительность можно разделить на следующие пункты:

1. Проверка процессорозависимости встроенной графики. Для этого были протестированы три режима частот работы процессора: 3700 МГц, 4100 МГц и 4500 МГц. Поскольку последний режим весьма горяч, то при проверке процессорозависимости использовалась частота работы графического процессора 960 МГц (для этого еще не приходится значительно увеличивать напряжения питания), в качестве режима работы памяти был выбран DDR3-1866 8-9-9-22-1T.

2. Проверка зависимости результатов от разгона графического процессора. Для этого были протестированы три режима работы частот встроенной графики: 720 МГц (штатная частота), 900 МГц (промежуточное значение) и 1028 (максимальный разгон без изменения базовой частоты) МГц. Здесь можно взять результаты, оставшиеся от тестирования процессорозависимости при частоте 960 МГц.

3. С наиболее производительным режимом работы графического процессора, то есть на частоте 1028 МГц, проверка влияния на производительность различных режимов работы памяти:

  • DDR3-1600 9-9-9-24: данный режим покажет производительность системы, если к разгону памяти не прибегать;
  • DDR3-1600 6-7-7-20: данный режим покажет производительность системы при низкой частоте работы памяти, но с агрессивными таймингами;
  • DDR3-1866 10-10-10-28: данный режим покажет производительность системы при попытках разгона неудачных комплектов памяти;
  • DDR3-1866 8-9-9-22: максимум, на что способен тестовый экземпляр процессора без изменения базовой частоты.

В этот подраздел были включены два режима максимального комплексного разгона процессора, с режимами работы памяти DDR3-2069 8-10-10-25 и DDR3-1941 8-9-9-22.

4. Сравнение максимально-производительного режима со штатным (путем сброса BIOS) и подведение итогов.

Анализ влияния на результаты разгона CPU NB не проводился из-за практически полного отсутствия возможностей разгона у оного. Во всех тестовых режимах (кроме режимов максимального разгона памяти с изменением базовой частоты) частота работы CPU NB была зафиксирована на 2000 МГц.

Для теста производительности использовались следующие приложения и настройки:

  • HWBOT Unigine Heaven Benchmark, тест Basic DX9. Итоговый результат – лучший по итогам двух замеров;
  • Crysis 3 (Добро пожаловать в джунгли), 1600 x 900, AA Off, параметры системы: низкие, разрешение текстур: среднее. Итоговый результат – усреднение четырех замеров;
  • F1 2013 (встроенный тест), 1920 x 1080, AA Off, детализация: высокая. Итоговый результат – усреднение четырех замеров;
  • Far Cry 3 (Harvest The Jungle), 1600 x 900, AA Off, DirectX 11, Overall Quality Medium. Итоговый результат – усреднение четырех замеров;
  • Hitman: Absolution (встроенный тест), 1600 x 900, качество – низкое. Итоговый результат – усреднение четырех замеров;
  • Sleeping Dogs (встроенный тест), 1600 x 900, уровень графики – средний. Итоговый результат – усреднение трех замеров;
  • Metro: Last Light (встроенный тест), 1600 х 900, АА0 AF4x DX11, Quality – Medium, Tessellation Off. Итоговый результат – усреднение четырех замеров;
  • The Elder Scrolls V: Skyrim (Поместье «Златоцвет»), 1600 x 900, AA0 AF16, детализация High. Итоговый результат – усреднение четырех замеров;
  • World of Tanks 0.9.2 (Химмельсдорф – стандартный бой), 1600 х 900, качество – среднее. Итоговый результат – усреднение четырех замеров.

Зависимость результатов производительности от разгона процессора

Тест 3700 МГц 4100 МГц 4500 МГц
HWBOT Unigine Heaven Benchmark 804.2589 804.286 804.799
Crysis 3 27/31.5 27/31.7 27/31.7
F1 2013 44/43 45/53 44/52
Hitman: Absolution 30/36.9 30/36.7 29/36.8
Far Cry 3 36/38.7 36/38.8 35/38.8
Sleeping Dogs 36/52.9 37/52.7 36/52.6
Metro: Last Light 28.43 28.5 28.45
The Elder Scrolls V: Skyrim 46/55.8 46/55.9 45/55.5
World of Tanks 0.9.2 16/33.8 16/33.8 16/33.8

По результатам тестирования видно, что встроенная графика Kaveri к процессорозависимости не склонна, результаты производительности от увеличения частоты работы ЦП практически не изменяются. Более того, режим с частотой работы процессора 4500 МГц пусть и в пределах погрешностей, но стабильно медленнее в большинстве приложений, что возможно указывает на грань стабильности из-за высокого напряжения питания.

Дальнейшие тесты было решено проводить при частоте работы A10-7850K 4100 МГц.

Зависимость результатов производительности от разгона графического процессора

Тест 720 МГц 900 МГц 960 МГц 1028 МГц
HWBOT Unigine Heaven Benchmark 742.8431 791.6685 804.286 813.5209
Crysis 3 26/29.8 27/31.2 27/31.7 27/31.8
F1 2013 42/49 43/52 45/53 45/53
Hitman: Absolution 29/35.8 30/36.5 30/36.7 30/37
Far Cry 3 30/33.8 34/37.9 36/38.8 36/39.5
Sleeping Dogs 33/50.3 35/52.3 37/52.7 37/53.4
Metro: Last Light 26.86 28.25 28.5 28.72
The Elder Scrolls V: Skyrim 42/51.4 45/55.1 46/55.9 47/56.5
World of Tanks 0.9.2 16/31.6 16/33.4 16/33.8 16/34.2

Основной прирост производительности наблюдается при переходе от режима 720 МГц к режиму 900 МГц. Видимо, при дальнейшем разгоне графического процессора начинает остро не хватать частоты работы памяти 1866 МГц, ибо разница между режимами 900 МГц и 960 МГц невелика, а между режимами 960 МГц и 1028 МГц ее и вовсе нет. По крайней мере, без FRAPS в трее пользователь разницы между 960 МГц и 1028 МГц не увидит.

Уже сейчас напрашивается вывод, что если с разгоном оперативной памяти не повезло, то нет смысла выжимать все соки из графического процессора, и «жечь» процессор высокими напряжениями.

Что ж, пришло время проверить различные режимы работы памяти в деле.

Зависимость результатов производительности от режимов работы памяти

Тест DDR3-1600
9-9-9-24
DDR3-1600
6-7-7-20
DDR3-1866
10-10-10-28
DDR3-1866
8-9-9-22
HWBOT Unigine Heaven Benchmark 715.872 726.893 797.119 813.5209
Crysis 3 24/27.9 24/27.9 26/31.3 27/31.8
F1 2013 39/46 39/47 43/51 45/53
Hitman: Absolution 27/32.5 27/33.2 29/36 30/37
Far Cry 3 33/36 33/36.5 35/38.7 36/39.5
Sleeping Dogs 32/47.2 33/48 36/52.1 37/53.4
Metro: Last Light 24.98 25.24 28.02 28.72
The Elder Scrolls V: Skyrim 42/50.5 42/51.3 46/55.3 47/56.5
World of Tanks 0.9.2 13/30.3 13/30.2 14/34 16/34.2

Сравнение двух режимов работы памяти с разными частотами и двух режимов работы памяти с разными таймингами показывает, что влияние частоты работы памяти является основополагающим. Режим DDR3-1866 10-10-10-28 везде и намного производительнее, чем DDR3-1600 6-7-7-20.

Что касается снижения таймингов при неизменной частоте, то небольшой прирост производительности есть, и пренебрегать им не стоит, особенно когда по частоте память разгоняться не хочет. Тем более что подбор таймингов никак не повлияет на температурный режим работы APU и его энергопотребление.

Режимы максимального комплексного разгона процессора

Тест CPU 4100 МГц,
GPU 1028 МГц,
DDR3-1866
8-9-9-22
CPU 4471 МГц,
GPU 1070 МГц,
DDR3-1941
8-9-9-22
CPU 4461 МГц,
GPU 1074 МГц,
DDR3-2069
8-10-10-25
HWBOT Unigine Heaven Benchmark 813.5209 839.3453 885.1873
Crysis 3 27/31.8 29/33.3 30/34.6
F1 2013 45/53 46/55 48/57
Hitman: Absolution 30/37 31/38.4 32/39.5
Far Cry 3 36/39.5 37/41 39/42.6
Sleeping Dogs 37/53.4 39/55.3 39/57.5
Metro: Last Light 28.72 29.79 31.05
The Elder Scrolls V: Skyrim 47/56.5 49/58.7 51/59.3
World of Tanks 0.9.2 16/34.2 18/35.4 18/36.2

Судя по результатам комплексного разгона процессора, попытки полностью «выжать» его частотный потенциал не прошли даром, особенно это касается режима с базовой частотой 97 МГц (к слову, далеко не все материнские платы это умеют), который позволил использовать множитель частоты работы памяти х21.33.

А режим с максимальным разгоном памяти очередной раз показал, что производительность APU AMD упирается именно в память, и тем обиднее получить такой слабый контроллер памяти, как у моего экземпляра ЦП. Особенно на фоне того, что при переходе от процессоров Trinity к Richland контроллер памяти позволял почти без проблем использовать режим DDR3-2400, а здесь более производительный графический процессор вынужден ограничиваться частотой 2069 МГц.

Сравнение режима максимальной производительности со штатным

Тест Полностью
штатный
режим*
CPU 4100 МГц,
GPU 720 МГц,
DDR3-1866
8-9-9-22
CPU 4461 МГц,
GPU 1074 МГц,
DDR3-2069
8-10-10-25
Процент
прироста**
HWBOT Unigine Heaven Benchmark 641.581 742.8431 885.1873 38%
Crysis 3 22/25.5 26/29.8 30/34.6 36.4% / 35.7%
F1 2013 35/42 42/49 48/57 37.1% / 35.7%
Hitman: Absolution 23/30 29/35.8 32/39.5 39.1% / 31.7%
Far Cry 3 27/30.4 30/33.8 39/42.6 44.4% / 40.1%
Sleeping Dogs 32/43.2 33/50.3 39/57.5 21.9% / 33.1%
Metro: Last Light 22.82 26.86 31.05 36.1%
The Elder Scrolls V: Skyrim 37/44.6 42/51.4 51/59.3 37.8% / 33%
World of Tanks 0.9.2 13/27.1 16/31.6 18/36.2 38.5% / 33.6%
*Режим, полученный путем сброса BIOS.
**Процент прироста производительности при переходе от наименее производительного режима к наиболее производительному.

В сравнении с режимом сброса BIOS режим максимального разгона ЦП производительнее в среднем на 35-36%, и максимум прироста приходится на штатный режим работы памяти, который устанавливает система (DDR3-1600 11-11-12-28-2Т). В качестве исключения можно отметить разве что Far Cry 3, этой игре штатной частоты работы графического процессора не хватает.

Если не учитывать результаты Far Cry 3, а также не сравнивать результаты максимального разгона с полностью штатным режимом, то разница уже не является такой высокой. Режим разгона памяти до 1866 МГц при штатной частоте графического процессора по производительности находится практически посередине между полностью штатным и полностью разогнанным процессором.

Заключение

Собственно, добавить что-либо к уже сказанному в статье нечего, осталось лишь систематизировать всю полученную информацию. Итого, в хронологическом порядке:

  • Для поиска стабильных частот встроенной графики лучше всего проявили себя игры и тесты производительности, в синтетических «грелках» процессор вполне умеет «защищаться» от стрессовой нагрузки. Среди игр лучше всего нестабильность «отловили» The Elder Scrolls V: Skyrim и Far Cry 3, среди тестов производительности лучший результат у HWBOT Unigine Heaven Benchmark.
  • При разгоне графического процессора в большинстве случаев есть четкая граница «работает/не работает», при высоких частотах если есть нестабильность, то она будет практически везде.
  • Графический процессор Kaveri очень хорошо реагирует на увеличение напряжения питания CPU NB, разгон GPU составил внушительные 48%.
  • Процессорозависимость в его случае практически отсутствует.
  • В разгоне графического процессора есть смысл, но если у экземпляра APU плохой разгон памяти, то уже свыше 960-1028 МГц дальнейший разгон особых дивидендов не принесет. Для процессоров с низким частотным потенциалом памяти вполне можно остановиться на 960 МГц, это позволит не использовать слишком высокие напряжения CPU NB.
  • Основной вклад для достижения высокой производительности привносит оперативная память, чем ее частота выше – тем выше и производительность. К сожалению, разгон памяти является фактором удачи, и в сравнении с процессорами Richland его роль выросла.
  • В среднем по тестовому пакету комплексный разгон процессора дает прибавку производительности на 35-36 %, большая часть прироста приходится на разницу в режимах работы памяти.
  • Стоит сказать «спасибо» BIOS материнских плат ASUS, которые позволяют снижать значение базовой частоты ниже штатного значения, иначе даже такой скромный результат разгона памяти, как 2069 МГц, был бы недостижим.

Конев Иван aka Ivan_FCB


Выражаем благодарность:

  • Компании AMD за предоставленный на тестирование процессор AMD A10-7850K;
  • Компании ASUS за предоставленную материнскую плату ASUS A88X-PRO.