NVIDIA Pascal. Изучаем дно андервольтинга на 625 мВ.

для раздела Блоги

Доброго времени суток, уважаемые читатели!

Перед тем, как писать эту статью, у меня были сомнения в ее актуальности - ведь через несколько дней семейство Pascal станет ушедшей эпохой. Но, читая форумы, особого энтузиазма по поводу перехода на RTX не замечается. В первую очередь из-за баснословной цены.
Объемы памяти тоже не радуют (5 Гб на GTX 2060? Серьезно?), как и качество картинки и производительность игр в режиме трассировки лучей. Сотни, если не тысячи мемов "rtx on off", уже нарисованы, а что будет после анонса RTX?

И, учитывая, что "игор нет", а вторичный рынок просто завален паскалями после отшумевшего бума майнинга и даже Ti-шками (уже почти по 25к), это семейство имеет все шансы побить рекорд долгожительства на рынке видеокарт и еще долгие годы радовать любителей игр.
Особенно самая популярная народная GeForce GTX 1060, в steam ее доля уже 13.3% и продолжает расти.

Вот и я, сидя на MSI GeForce GTX 1060 GAMING X 6G уже 2 года, доволен ей чуть более чем полностью и не собираюсь менять в ближайшую пару-тройку лет.
Но два "белых пятна" паскалей не дают покоя до сих пор. Одно из них - отсутствие редактора биос. Второе - работа на напряжениях намного выше и ниже стандартных.

Редактор биоса, надеюсь, когда-нибудь дождемся. Повысить напряжение в моем случае удалось всего до 1093 мВ и это дало прирост всего в 26-39 МГц (2-3 шага буста), а вот работа на напряжениях ниже 800 мВ, как оказалась, вполне доступна программно.

Вероятно, многие из вас видели такие напряжения при неполной загрузке GPU со включенной вертикальной синхронизацией или ограничением кадров в секунду (фпс). Особенно впечатляют показатели энергопотребления при таких напряжениях.
И, думаю, почти всем читателям форума известен предел программной настройки напряжения через кривую "курву" MSI Afterburner. Ниже 800 мВ не пойдешь.
В этой статье мы шагнем еще ниже и снизим напряжение до 625 мВ. То есть до самого дна - это напряжение, на котором паскали работают в 2D режиме. А также разберем нюансы.

В частности:

 Разбор андервольтинга через NVIDIA Inspector.

 Замер энергопотребления видеокарты и всего ПК при напряжении на GPU в 625 мВ. А также замер      температур области VRM через отдельную термопару.

 Возможна ли работа GTX 1060 с качественной системой охлаждения в пассивном режиме на 625 мВ?

 Замер производительности GTX 1060 на напряжении 625 мВ. Примерно какой видеокарте она будет  равна?

 Если типичный сценарий использования андервольтнутой видеокарты - игры с неполной загрузкой GPU,  какова будет разница с простым ограничением фпс без андервольта.
 Как себя покажет обычный  андервольт в 800 мВ с вертикальной синхронизацией?

Также попытка программными методами заставить обычный ПК работать в режиме ультранизкого потребления электроэнергии без существенного падения производительности.

"А как же майнинг?" - спросят некоторые форумчане. Майнинг уже подходит к уровню розетки - к печали одних и радости других (хотя радость была недолгой, падение рубля так и не дало ценам на видеокарты вернуться в норму).
Майнинг эфира и других монет на ethash алгоритмах на напряжении 625 мВ в плане энергоэффективности хорош. Но исследовать его уже не вижу смысла.


Тестовый стенд и инструментарий:

Процессор: Intel Core i5-4670
Кулер: Zalman 10X Performa
Материнская плата: ASUS H87-PLUS
Оперативная память: Kingston DDR3 16 Gb 1600MHz (4x4Gb)
Видеокарта: MSI GTX 1060 Gaming X 6G
Накопители: SSD OCZ-VERTEX3 120 Гб + HDD 5400rpm
Корпус: Fractal Design Define R4, вентиляторы 4 шт, 900 об/мин. Боковая крышка открыта на время тестов.
БП: Chieftec CFT-700-14CS.

Измерение энергопотребления ПК - ИБП CyberPower Value 600EI с выводом потребления через HWiNFO64 в OSD.
Замер температуры области VRM - мультиметр Elitech MM300 c термопарой.
Операционная система: Windows 10 х64.
Видеодрайвер: 388.43
Главный инструмент для снижения напряжения до 625 мВ — NVIDIA Inspector версии 1.9.7.8.
Тест стабильности - Fire Strike Stress-test.
Тест производительности - 3DMark Fire Strike, Far Cry 4.
Пример нетребовательной к железу игры - Shadows: Awakening.
 

Приступаем к тестам.

Для начала я закрепил термопару, зажатую в сложенную термопрокладку, между текстолитом и пластиной, отводящей тепло от VRM и памяти. Место не самое удачное, карта на гарантии и особо не разгуляешься без снятия бэкплейта и СО, но "среднюю температуру по больнице" покажет. Температура в комнате 26 градусов.



Для сравнения по температурам и потреблению возьмем стандартные настройки видеокарты. При запуске стресс-теста проходит пара минут до момента, когда чип прогреется выше 60С, и запустятся вентиляторы. Зона с термопарой гораздо более инертна в плане нагрева, проходит не менее 5-8 минут до стабилизации температуры.
После 15 минут стресс-теста мы имеем частоту 1924 МГц, температуру чипа около 64С, зона с термопарой стабилизировалась на 60С.
Обороты кулера в районе 950. Эти обороты кулера мы возьмем для других режимов для корректного сравнения.
Потребление видеокарты по HWiNFO64 колеблется в районе 120 Вт. Весь ПК потребляет из розетки 180 Вт.


Пару слов про блок питания: он имеет избыточную для этого ПК мощность в 700 Вт и через месяц отметит свое десятилетие. Поэтому никакими сертификациями даже 80 PLUS там и не пахнет. Хорошо, если КПД будет в 75%. Поэтому 180 Вт потребления из розетки - это реальное потребление компонентов ПК в 135-140 Вт.


Андервольт через NVIDIA Inspector.

Теперь займемся настройкой NVIDIA Inspector. Я скачал версию 1.9.7.8 с сайта www.guru3d.com, ссылка -  https://www.guru3d.com/files-details/nvidia-inspector-download.html

Утилита довольно проста и, самое забавное, что нам даже не придется запускать nvidiaInspector.exe и тем более двигать ползунки и жонглировать мышью, как при настройке кривой в MSI Afterburner.
Вся прелесть этой утилиты - конфигурирование через bat файлы (батники). Bat файл можно создать в любом месте и прописать путь к утилите или, что проще, прямо в ее папке.
В 1-м случае "C:\nvidiainspector\nvidiaInspector.exe", если утилита лежит в папке C:\nvidiainspector, во 2-м - в батнике достаточно просто указать "nvidiaInspector.exe".
Bat файлы можно создавать довольно сложные, поддерживаются переменные, опишу те, которые пригодятся:

SET FAN=%% - фиксация оборотов кулера (вместо %% ставим число процентов, например 38), если фиксация не нужна, то можно удалить строку.

SET VOLT=%%%%%% - вольтаж.
1050000 - 1050 мВ, 625000 - 625 мВ и т.д.

SET TEMP=%% - фиксация лимита температуры (вместо %% ставим число в градусах, например 65), если не требуется, можно удалить строку.

SET GPU* - вместо * ставим номер GPU. Если видеокарта в системе одна, то GPU0.

Для всех переменных можно прописать несколько строк для нескольких значений, новые строки должны быть формата SET FAN1=%% SET VOLT1=%%%%%% и т.д.

Теперь параметры :

-setMemoryClockOffset:%,0,* - параметры разгона памяти.
  вместо % ставим номер GPU (должен совпадать с номером в SET GPU*)
  вместо * ставим, число на которое хотим разогнать память или понизить частоту (пример 300 или -300, если не нужно, то 0)

-setBaseClockOffset:%,0,* - параметры разгона ядра.
  вместо % ставим номер GPU (должен совпадать с номером в SET GPU*)
  вместо * ставим число, на которое хотим разогнать ядро (пример 150, или -100, для понижения частоты, если не нужно, то  0)

-setFanSpeed:*,%FAN% - параметры скорости кулера.
  вместо * ставим номер GPU (должен совпадать с номером в SET GPU*)
  %FAN% не трогаем, если значение прописано в параметре SET FAN=%%
  или просто ставим -setFanSpeed:0,38 для задания 38% оборотов вентилятора GPU0, к примеру.

-lockVoltagePoint:*,%VOLT% - параметры фиксации вольтажа, наш главный параметр для андервольта.
  вместо * ставим номер GPU (должен совпадать с номером в SET GPU*)
  %VOLT% не трогаем, если значение прописано в параметре SET VOLT=%%%%%%
  или просто ставим -lockVoltagePoint:0,625000 для фиксации напряжения в 625 мВ на GPU0.

  Важно! 
  Для отключения заблокированного вольтажа надо запустить аналогичный батник, но с параметром    -lockVoltagePoint:0,0 (иначе видеокарта не уйдет в энергосберегающий режим в 2D)

-setTempTarget:*,0,%TEMP% - параметры лимита температуры.
  вместо * ставим номер GPU (должен совпадать с номером в SET GPU*)
  %TEMP% не трогаем, если значение прописано в параметре SET TEMP=%%

Теперь примеры батников :

@echo off
SET VOLT=625000
SET FAN=38
SET GPU0=-setMemoryClockOffset:0,0,0 -setBaseClockOffset:0,0,0 -lockVoltagePoint:0,%VOLT% -setFanSpeed:0,%FAN%
"C:\nvidiainspector\nvidiaInspector.exe" %GPU0%
pause


Данный батник устанавливает напряжение в 625 мВ, обороты вентилятора в 38%. "pause" удобно добавить на время отладки - чтобы видеть ошибки.
Для просмотра результата проще всего запустить GPU-Z с рендером (кнопка "?" возле PCI-E параметров), открыть вкладку sensors и смотреть, что получится.

Теперь более простой батник, делающий то же самое, но уже лежащий в папке с NVIDIA Inspector:

@echo off
SET GPU0=-setMemoryClockOffset:0,0,0 -setBaseClockOffset:0,0,0 -lockVoltagePoint:0,625000 -setFanSpeed:0,38
"nvidiaInspector.exe" %GPU0%
pause


Все параметры указаны явно, без задания переменных.

Запускаем GPU-Z с рендером, или любую другую нагрузку на видеокарту с мониторингом, запускаем этот батник и смотрим результат. Видим напряжение в 625 мВ, обороты вентилятора в 38% и довольно странную частоту в 974 МГц. Откуда взялась эта частота и почему она именно такая?
Тут начинается самое интересное.
По сути, мы сейчас видим тот самый "хвост" кривой из MSI Afterburner, который лежит ниже границы 800 мВ и недоступен для редактирования. И сочетания "напряжения + частота" берутся из биоса видеокарты.


Если вы уже настраивали кривую в MSI Afterburner и оттестировали какую-то точку "напряжение + частота" на стабильность, можете прописать напряжение в батник, приплюсовать частоту (на которую поднимаем кривую) и получить видеокарту, работающую на проверенном напряжении, но без сброса частот и напряжений, они заблокированы.

Единственное - могут быть отклонения на 1-2 шага буста и плюс-минус соседние точки напряжений. Не забываем, что эти точки плавают в зависимости от нагрузки и температуры.
Мне, чтобы получить годами проверенное сочетание 931 мВ при 1949 МГц, пришлось выставить -setBaseClockOffset:0,0,141 -lockVoltagePoint:0,932000

На напряжении 931 мВ у моей видеокарты запас по разгону в 141 МГц. Этот запас приблизительно одинаков для каждой точки, плюс-минус 1-2 шага буста. Если я прибавлю 141 МГц к частоте на напряжении 1062 мВ, получаю примерный потолок своей видеокарты по разгону - 2088-2100 МГц .

И на точке 625 мВ мы как минимум можем прибавить этот разгонный потенциал, в моем случае 141 МГц. Но, протестировав потщательней, оказалось, что видеокарта стабильна в Fire Strike Stress-test на частоте 1164 МГц. В батнике для этого дописал -setBaseClockOffset:0,0,200
Видимо, за счет крайне низких температур, на "дне" напряжений выигрываются уже 2-3 шага буста.

Батник, который будет использоваться для тестов андервольта на 625 мВ:

@echo off
SET GPU0=-setMemoryClockOffset:0,0,0 -setBaseClockOffset:0,0,200 -lockVoltagePoint:0,625000 -setFanSpeed:0,38
"nvidiaInspector.exe" %GPU0%

Профиль андервольта готов, можно даже не использовать MSI Afterburner, но он мне понадобится, так как режим на 800 мВ через кривую я тоже сравню по температурам и производительности (с недогрузом GPU и вертикальной синхронизацией) с 625 мВ.


Тесты на стабильность и температуры в Fire Strike Stress-test.

Для начала режим на 800 мВ. Интересно сравнить режим 625 мВ не только со стоком, но и с самым глубоким андервольтом через кривую MSI Afterburner. После 20 минут стресс-теста мы имеем частоту в 1709 МГц, температуру GPU в 48С, зона с термопарой стабилизировалась на 45С.
Потребление GPU по HWiNFO64 колеблется в районе 68 Вт. Весь ПК потребляет из розетки 126 Вт.
Очень впечатляет по сравнению со стоком падение температуры на VRM. Можно сказать, VRM холодная. Потребление тоже радует. GPU ест почти половину от паспортных 120-ти ватт.


Теперь сбрасываем видеокарту в дефолт в MSI Afterburner и запускаем батник на 625 мВ.

После 22 минут стресс-теста частота держится на 1164 МГц, температура GPU на 41С.
Потребление GPU в районе 46 Вт. Весь ПК потребляет из розетки 97 Вт.
VRM уже ледяная - около 40-41С. Энергопотребление просто рекордное.
46 Вт потребления, это уже уровень даже не GTX 1050, это уже ближе к GTX 1030!


Сразу попробуем, выдержит ли охлаждение MSI GTX 1060 GAMING тест стабильности Fire Strike в пассиве при таком тепловыделении.
В целом по температурам терпимо, 65 градусов на чипе, 49-50 на VRM, но начинаются странности, с ростом температуры растет частота GPU до 1215 МГц, хотя должна падать. Приходится откатываться и снижать частоту.
Параметр -"setFanSpeed:0,0" не остановил вентиляторы, помогло установить скорость вентиляторов в 1% для их остановки. Но, раз в минуту-две, вентиляторы запускались на пару секунд и останавливались.
Это с учетом открытого корпуса с работающими вентиляторами. С натяжкой можно назвать это годным к пассивному охлаждению по температурам. Если же охлаждение более слабое, то игра вообще не стоит свеч.


Теперь можно приступить к тесту производительности, думаю 3DMark Fire Strike вполне хватит для оценки.
Для начала прогоним видеокарту в стоке и получаем 10214 очков (graphics score 13547). Частота держалась на 1924-1936 МГц.
На 625 мВ и частоте 1164 МГц получаем 7709 очков (graphics score 9361). Потери производительности по graphics score около 30%, но это при снижении энергопотребления с 120-ти до 43-48 Вт (на 60%!). Ни в тесте стабильности, ни в тесте производительности энергопотребление не превысило 48 Вт.


Для сравнения, graphics score GTX 1050 Ti в разгоне до 1800-1900 МГц составляет примерно 8200-8500 (по результатам 3DMark Fire Strike). То есть, мы получили видеокарту примерно на 10% быстрее GTX 1050 Ti, с энергопотреблением не выше 48 Вт (энергопотребление GTX 1050 Ti, напомню - 75 Вт по паспорту, 60-68 фактическое).

Результат очень впечатляющий, особенно если вспомнить, какое потребление было совсем недавно у видеокарт сопоставимой мощности : GTX 770 - 230 Вт, Radeon R9 285 - 190 Вт, GTX 960 - 120 Вт.

Для еще более сильного снижения потребления и нагрева можно занизить и пропускную способность памяти. Она теперь избыточна, и снижение частоты памяти на 500 мгц дает уменьшение ПСП с 192 до 168 ГБ/c. Вполне достаточно для такой производительности, у GTX 1050 Ti ПСП всего 112 ГБ/c. Но это уже на любителя, в тестах оставлю стандартное значение.


Теперь можно приступить к тестам с неполной загрузкой GPU. Старые хиты и нетребовательные игры с вертикальной синхронизацией - это один из самых распространенных вариантов использования видеокарты с сильным андервольтом. Когда месяц, другой, третий включаешь только Fallout: New Vegas, S.T.A.L.K.E.R. и Anno 1404: Венеция, видеокарта хорошо, если только в половину мощности работает.
Сейчас попробуем разобраться - имеет ли смысл такой сильный андервольт, сравнив его в старых играх со стоком и обычным андервольтом через курву MSI AB на 800 мВ.

Из игр на момент тестирования из нетребовательных стояла недавно вышедшая Shadows: Awakening и Far Cry 4. Скриншоты снимались в одном и том же месте, глядя в одну точку. Температуру зоны VRM я добавил на скриншоты.

Начнем с Far Cry 4. На скриншоте я свел 3 режима - сток, 800 мВ и 625 мВ.
С максимальными настройками он выдает в месте замера около 70-95 фпс без вертикальной синхронизации. Теперь посмотрим на частоты, напряжение, энергопотребление и фпс.
Сток с вертикальной синхронизацией показывает 1430 МГц, 750мВ, 52 Вт потребления и стабильные 60 фпс.
Режим 800 мВ показывает 1392 МГц, 693мВ, 50 Вт потребления и тоже стабильные 60 фпс.
Режим 625 мВ показывает 1164 МГц, 625мВ, 41 Вт потребления, но стабильные 60 фпс в динамике уже не выдает, проседает до 45 кадров, что делает вертикальную синхронизацию неприемлемой.


Температуры GPU и VRM радуют. Даже не верится, что это игра, а не режим простоя.

По энергопотреблению, чем ближе частота кадров к лимиту (в моем случае 60 фпс), тем сильнее отрыв андервольтнутой видеокарты. В обычном режиме видеокарта поднимает напряжение и частоту, чтобы не дать просесть кадрам у отметки 60. И потребление вырастает иногда до стандартных 120 Вт в стоке.

С сильным андервольтом, с урезанием частоты - уменьшается запас по фпс.
Если же вертикальная синхронизация не нужна, и скачки кадров от 45 до 70 не пугают, то можно бодро бегать на максималках, и потребление при этом на 625 мВ не превышает 48 Вт. Это производит впечатление, особенно потребление всего ПК в таком режиме. На видео еще эффектней.


Теперь Shadows: Awakening. Здесь запас по кадрам более чем достаточный. Даже на 625 мВ с урезанной частотой видеокарта выдает около 90 фпс без вертикальной синхронизации. Поэтому во всех трех режимах мы видим напряжение в 625 мВ и потребление в районе 40 Вт.


Попробовал еще ANNO 2070 - картина такая же, как в Shadows: Awakening.

Как видим, все зависит от конкректной игры и нагрузки на GPU. Поэтому более универсальным и подходящим для большинства игровых ситуаций остается андервольт без существенного снижения частоты. 850-950 мВ и частоты стока вполне достаточно и для тяжелых и для нетребовательных игр.
И даже сток без андервольта в нетребовательных играх с вертикальной синхронизацией вполне хорош по энергопотреблению.


Ультранизкое потребление.

Как вы видели из тестов выше, на напряжении 625 мВ видеокарта потребляет не более 48 Вт, а весь ПК в Far Cry 4 - не больше 120 Вт. Чтобы пойти еще ниже, осталось андервольтнуть процессор, но он уже давно андервольтнут), напряжение снижено на 10%. Его вполне хватает в Far Cry 4 и можно снизить частоту и напряжение еще ниже - через схему питания Windows.


Частота 2095 МГц, напряжение 0.78 В и потребление почти на уровне ноутбучных процессоров. Запускаем Far Cry 4 и вуаля, ПК потребляет из розетки менее 100 Вт. При этом Far Cry 4 бегает довольно бодро на максималках.
Если учесть потери в БП в районе 25%, то все железо потребляет ватт 75. Если отключить корпусные и процессорный вентиляторы, что уже никак не повлияет на охлаждение - это даст скинуть еще 7-10 Вт (5 вентиляторов по 1.5-2.5 Вт). Оставить только SSD - еще пара ватт.
И остается занизить напряжение на DDR3 SDRAM, 4 планки как никак, и можно запитать комп от ноубучного БП (шутка, я конечно фанат андервольта, но не настолько).



Итоги:

Как оказалось, режим на 625 мВ потрясающ в плане энергоэффективности, но использование его в играх уже спорно. В совсем нетребовательных и сток достаточно энергоэффективен. Если же включать вертикальную синхронизацию, производительности на 625 мВ может хватить уже не везде. Все зависит от конкретных ситуаций и набора игр.

Но изюминка оказалась в другом - в самом методе андервольта через NVIDIA Inspector.
По сравнению с MSI Afterburner у NVIDIA Inspector есть несколько козырей: простота, надежность и легкий перенос профилей при переустановке Windows. Тот, кто хоть раз терял профили кривой MSI Afterburner, меня поймет. Настройка ее - дело непростое и муторное. Вплоть до зависимости от версии драйвера и даже температуры в помещении.

С NVIDIA Inspector таких проблем нет, даже инсталляция не требуется.
Достаточно раз создать батник под определенную игру с нужной степенью андервольта и все, никаких кривых "курв". Даже устанавливать MSI Afterburner не надо.
И еще потенциальный плюс - за счет заблокированных частоты и напряжения, в теории, время кадра должно стать стабильнее.
Это можно опробовать тем, кто страдает от фризов на паскалях, а их не мало, судя по теме "DPC latency на видеокартах Nvidia" у нас на форуме.

Пример батника, блокирующего 1164 МГц при 625 мВ, запускающего Far Cry 4 и разблокирующего назад при выходе из игры (иначе видеокарта не уйдет в энергосберегающий режим в 2D).

@echo off
SET GPU0=-setMemoryClockOffset:0,0,0 -setBaseClockOffset:0,0,153 -lockVoltagePoint:0,625000
"nvidiaInspector.exe" %GPU0%
"D:\Games\Far Cry 4\bin\FarCry4.exe"
SET GPU0=-setMemoryClockOffset:0,0,0 -setBaseClockOffset:0,0,0 -lockVoltagePoint:0,0
"nvidiaInspector.exe" %GPU0%


К сожалению, на руках у меня только 1060, а очень интересно было бы погонять таким методом более мощные паскали - 1070, 1080, 1080 Ti. Там и потребление больше, но и запас мощности для Full HD в 60 фпс более чем достаточный.
Буду очень благодарен, если кто-то из форумчан с такими видеокартами погоняет режим 625 мВ в играх и тестах и напишет в комментариях о температурах и энергопотреблении.


Telegram-канал @overclockers_news - это удобный способ следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал
рейтинг: 4.6 из 5
голосов: 43

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают