Исследуем проблему с памятью видеокарты Nvidia GeForce GTX 970
Оглавление
- Вступление
- Тестовый стенд и ПО
- Инструментарий и методика тестирования 3D
- Тестирование производительности
- Metro Last Light
- Sleeping Dogs
- Company of Heroes 2
- Sniper Elite III
- Thief (2014)
- Tomb Raider (2013)
- Total War Rome II
- Far Cry III
- Crysis 3
- Battlefield 4
- Заключение
Вступление
Споры по поводу неправильного и нелогичного поведения GeForce GTX 970 начались несколько месяцев тому назад. Некоторые пользователи недоумевали, почему видеокарта не использует более 3.5 Гбайт памяти, другие находили режимы, где она резко проваливалась в скорости.
И лишь спустя время в компании Nvidia нашли силы признать неточность в описании и почти публично извиниться. Причем некоторые магазины даже объявили о возможности сдачи новинок обратно со стопроцентной компенсацией. Но дальнейшая реакция пользователей была вызвана не самой неточностью в описании, а фактом обмана покупателей.

реклама
Позднее с помощью СМИ Nvidia рассказала о фактическом строении графического ускорителя, правда, тайну приоткрыли лишь частично, а все нюансы архитектуры так и остались под грифом «Секретно». Из раскрытой информации выяснилось, что последние 0.5 Гбайт памяти используются редко и обладают существенно меньшей пропускной способностью (28 Гбит против 192 Гбит). Это происходит потому, что последний сегмент делит ресурсы с контроллерами памяти и одинарным сегментом L2 кэша. Возможно, вам уже встречалась схема, объясняющая топологию GeForce GTX 970.

В дальнейшем многие заявили о наличии у GeForce GTX 970 лишь 56 ROP, но немногие попробовали хотя бы посчитать и проанализировать полученные данные. В младшей модели поколения Maxwell количество мультипроцессоров меньше, нежели у GeForce GTX 980, и даже если бы она содержала 64 ROP вместо 56, производительность закраски и смешивания была бы ограничена количеством экспортируемых мультипроцессорами пикселей (52 пикселя за такт). Таким образом, что с 64 ROP, что с 56 ROP скорости закраски и смешивания будут одинаковыми. Но даже в последнем случае возникают подозрения в том, что часть из них остается незадействованной.
А вот пиковая пропускная способность памяти указана как раз правильно. Ведь никого не удивляет тот факт, что на жестких дисках пишут объем в гипотетических гигабайтах, а для твердотельных накопителей указывают максимальную теоретическую скорость. По заявлениям инженеров компании Nvidia, GeForce GTX 970 изначально получила правильное соотношение CUDA Cores/ROP/TMU для раскрытия всего потенциала графического процессора в конкретной спецификации продукта.
Тестовый стенд и ПО
- Материнская плата: ASUS X99-Deluxe (Intel X99, LGA 2011-3);
- Процессор: Intel Core i7-5960X 4000 МГц (125 МГц х 32, 1.20 В);
- Система охлаждения: система водяного охлаждения;
- Термоинтерфейс: Arctic Cooling МХ-2;
- Оперативная память: DDR4 Corsair Vengeance 2750 МГц, 4 x 4 Гбайта, (15-15-15-36-1T, 1.65 В);
- Видеокарты:
- AMD Radeon R9 290X (референсная версия);
- Gainward GeForce GTX 970;
- Накопитель SSD: Corsair Force Series GT, 128 Гбайт;
- Блок питания: Corsair AX1200i Digital, 1200 Ватт.
Программное обеспечение:
- Операционная система: Microsoft Windows 7 x64 SP1;
- Версия драйверов: Nvidia GeForce Driver 347.52 WHQL, AMD Catalyst 15.x Beta.
Инструментарий и методика тестирования 3D
В части игр, где это возможно, использовались встроенные отрезки теста, при необходимости тестирование дополнялось результатами утилиты Fraps v3.5.99.
реклама
Список тестовых приложений:
- Battlefield 4;
- Company Of Heroes II;
- Crysis 3;
- Far Cry III;
- Metro Last Light;
- Sleeping Dogs;
- Sniper Elite III;
- Thief (2014)
- Tomb Raider (2013);
- Total War: Rome II.
VSync при проведении тестов был отключен.
Тестирование производительности
Metro Last Light
Настройки:
- DirectX 11;
- Quality – Very High;
- Texture filtering AF – 16x;
- Motion Blur – Normal;
- SSAA – On;
- Tessellation – Normal.
Проще всего начинать тестирование с распространенного разрешения – 1920 х 1080. Для большей нагрузки на память зададим наиболее сложные и качественные настройки в игре.
График загрузки локальной памяти.

3.5 Гбайт для Metro Last Light достаточно, и даже с избытком. В противовес видеокарте Nvidia GeForce GTX 970, AMD Radeon R9 290X подозрительно аккуратно обращается с памятью. Напомню, что она основана фактически на Hawaii с ее полноценным не усеченным доступом.
Переходим на один уровень выше и посмотрим, что происходит в разрешении 2К (2560 х 1440).

Чуть больше 1.6 Гбайт, это даже меньше половины объема доступной памяти. Поэтому никаких проблем нет, разве что с производительностью. На максимальных настройках GeForce GTX 970 едва волочит ноги, а среднее число кадров доходит всего до 30 к/с. Можно еще раз увеличить разрешение, но играть будет уже невозможно из-за низкой производительности.
Зато Radeon R9 290X даже не увеличила количество памяти, и это подозрительно. Возможно, где-то используются махинации с качеством текстур? Но на вид никаких отличий нет. Показатель скорости слегка превосходит таковой у оппонента и составляет 35 к/с.
А разная продолжительность теста обусловлена попыткой проверить, насколько увеличивается (и увеличивается ли) объем задействованной памяти в процессе с первого по шестой запуск теста. Как показала практика, делать все шесть замеров необязательно, количество используемой памяти показатель стабильный и не зависит от попыток.
реклама
Попробуем узнать, достаточно ли для стопроцентной загрузки более 3.5 Гбайт памяти разрешения 5120 х 1440, или нет?

Нет, этого явно недостаточно. Можно сказать, что для владельцев GeForce GTX 970 игра Metro Last Light быстрее упрется в физическую скорость GPU, чем в проблемный участок памяти. Кстати, Radeon R9 290X ненамного быстрее: 16 к/с против 12 к/с. В итоге для обеих видеокарт разрешение 4К не по зубам независимо от объема памяти на борту.
Sleeping Dogs
Настройки:
- Уровень сглаживания – экстрим;
- Текстуры высокого разрешения – включены;
- Разрешение теней – высоко;
- Фильтрация теней – высоко;
- Амбиентное затенение – высоко;
- Детализация мира – экстрим.
Попробуем номинальное разрешение 1920 х 1080.

И здесь никаких проблем, средняя скорость 72 к/с, чего с избытком хватает для этого типа игры. Загрузка памяти менее половины доступной. Модель AMD использует больший объем памяти, и ее производительность чуть ниже, всего 69 к/с.
Перейдем в следующее разрешение, а именно в 2560 х 1440 с аналогичными настройками качества.

Объем почти 2 Гбайта, результат обнадеживающий, но пока все воспроизводится на экране без каких-либо визуальных проблем. Средняя производительность у конкурентов одинаковая – 42 к/с.
Может быть, вдвое более высокое разрешение наконец-то выведет нас за пределы 3.5 Гбайт?

До желаемого рубежа не хватило чуть-чуть, а пока ограничимся 3.2 Гбайт. Допустим, что игра съела более 3.5 Гбайт, в таком случае началось бы существенное падение производительности. А теперь о реально происходящем: даже при использовании 3.2 Гбайт памяти и разрешении 5120 х 1440 средняя скорость всего 20 к/с!
Иными словами, мы быстрее упремся в практический потолок производительности графического процессора, чем в нехватку памяти. У видеокарты AMD схожие показатели: средние 21 к/с и чуть больший объем используемой памяти. Но в целом проблема явно не в ее нехватке.
Страницы материала
Лента материалов раздела
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии 186 Правила