Второе пришествие Maxwell: обзор и тестирование видеокарты NVIDIA GeForce GTX 980
реклама
Оглавление
- Вступление
- Технические характеристики
- GPU Maxwell
- Программные улучшения Maxwell
- Аппаратные улучшения Maxwell
- Обзор NVIDIA GeForce GTX 980
- Тестовый стенд
- Методика тестирования
- Инструментарий и методика тестирования 3D
- Результаты тестирования системы охлаждения
- Сравнение систем охлаждения
- Результаты разгона
- Уровень потребляемого электричества
- Результаты тестов
- Sleeping Dogs
- Sniper Elite V2
- Far Cry III
- Crysis 3
- Tomb Raider (2013)
- Metro Last Light
- Company Of Heroes II
- Total War: Rome II
- Battlefield 4
- Итоговые результаты
- Заключение
- За кадром
Вступление
Процесс развития графических процессоров немного застопорился на 28 нм техпроцессе. Отсутствие фактической возможности создать нечто новое на 16-20 нм вынуждает производителей разрабатывать более эффективные схемы.
Некоторую пищу для размышлений предоставил затронутый нами на NVIDIA Editor’s Day вопрос о времени проектирования современного GPU. Итак, срок от момента появления технического задания до воплощения задуманного в кремнии составляет не менее трех лет.
реклама
Другими словами, прошлая линейка графических процессоров NVIDIA, начиная с GK110, уже в момент пуска в серию начала перевоплощаться в существующий GM204. И работа инженеров заслуживает уважения: на неизменном техпроцессе уменьшить размер кристалла, ускорить его на 10%, снизить тепловыделение и общую стоимость – не каждому под силу.
Вопреки распространенному мнению, GM204 – это полноценный GPU без единого неактивного блока. Новую серию GeForce GTX 9xx открывают видеокарты GTX 970 и GTX 980. Существенных отличий между ними немного. Как всегда, под нож попали универсальные процессоры и скомбинированные с ними текстурные блоки. Но на этот раз разрыв возрос, с 1664 до 2048 PS.
А в описании к новым решениям NVIDIA намекнула, что GeForce GTX 970 и GTX 980 будут не единственными графическими ускорителями на ядре GM204.
Технические характеристики
|
GTX 770 |
GTX 780 |
GTX 780 Ti |
GTX 970 |
GTX 980 |
Кодовое имя |
|
|
|
|
|
Версия |
|
|
|
|
|
Техпроцесс, нм |
|
|
|
|
|
Размер ядра/ядер, мм2 |
|
|
|
|
|
Количество транзисторов, млн |
|
|
|
|
|
Частота ядра, МГц |
|
|
|
|
|
Частота ядра (Turbo), МГц |
|
|
|
|
|
Число шейдеров (PS), шт. |
|
|
|
|
|
Число текстурных блоков (TMU), шт. |
|
|
|
|
|
Число блоков растеризации (ROP), шт. |
|
|
|
|
|
Максимальная скорость закраски, Гпикс/с |
|
|
|
|
|
Максимальная скорость выборки текстур, Гтекс/с |
|
|
|
|
|
Тип памяти |
|
|
|
|
|
Эффективная частота памяти, МГц |
|
|
|
|
|
Объем памяти, Гбайт |
|
|
|
|
|
Шина памяти, бит |
|
|
|
|
|
Пропускная способность памяти, Гбайт/с |
|
|
|
|
|
Питание, pin |
|
|
|
|
|
Потребляемая мощность (2D / 3D), Ватт |
|
|
|
|
|
CrossFire/Sli |
|
|
|
|
|
Рекомендованная цена, $ |
|
|
|
|
|
Заменяемая модель |
|
|
|
GTX 780 |
|
GPU Maxwell
реклама
Каких-то глобальных изменений внутри организации GPU не произошло. Графический процессор GM204 состоит из четырех GPC, каждый из которых в свою очередь состоит из четырех SMM. Объем кэш-памяти остался прежним – 2 Мбайта.
Радикально изменилось число блоков растеризации, которые осуществляют операции записи пикселей в буферы и их смешивания. Они понадобились в таком количестве из-за возросших разрешений и активного использования фильтров постобработки и антиалиасинга. Чуть-чуть увеличился объем кэш-памяти в SMM – с 64 до 96 Кбайт.
На диаграмму не попали блоки вычислений DP – четыре штуки на один SMM. На самом деле GM204 чисто игровое решение, и скорость выполнения такого рода задач не особенно важна, хотя, с другой стороны, любители GPGPU-вычислений будут не рады.
История в картинках: развитие архитектур NVIDIA.
Программные улучшения Maxwell
Технология DSR (Dynamic Super Resolution)
Она позволяет достичь качества разрешения 4К на мониторах с разрешением 1080Р. Ранее мы видели аналогичную технологию, но под названием SuperSampling. В этот раз в NVIDIA пошли дальше.
DSR – это даже не разновидность SS, а способ умно применить фильтр Gaussian. Вроде бы что-то похожее нам уже встречалось, но теперь качество действительно максимально приближено к 4К разрешениям. Посмотрим на классический пример работы GPU.
Для начала берется геометрическая фигура, разбивается на пиксели и закрашивается (это очень упрощенная схема). В случае с DSR рендер происходит в 4К разрешении, из-за чего используется в четыре раза больше пикселей, но для того чтобы не было эффекта слишком большой резкости, к получаемому изображению применяется фильтр.
В итоге картинка получается четкой с большим количеством деталей, но при этом без чрезмерной резкости.
реклама
Естественно, что DSR не появится в настройках старых игр, придется ставить утилиту GeForce Experience и активировать ее. Причем уровень размытия фильтром будет настраиваемым, равно как и эффективное разрешение (от 1.2Х до 4Х).
Фильтр MFAA
Существующий сэмплинг MSAA достаточно красивый, но уж слишком трудозатратный. Особенно, если речь идет о 4х. Новый тип фильтра призван достичь, как минимум, не худшего эффекта.
Четырехкратная выборка позволяет достичь практически идеального изображения, но что делать, если ресурсов не хватает? Тогда можно воспользоваться двумя соседними кадрами с двукратной выборкой, оставляя данные по ней в буфере.
Затраты снижаются в два раза, а результат не хуже, чем с 4хMSAA. Все потому, что соблюдаются условия, идентичные 4xMSAA. Пока же режим MFAA только должен появиться в драйверах, и проверить заявление мы не можем. В среднем разница между 4xMSAA и 4xMFAA достигает 30%, естественно в пользу MFAA.
Voxel Global Illumination
Пожалуй, наиболее интересное нововведение, которое появилось в Maxwell. Обычное освещение, отображаемое в играх, мало соответствуют реальному. Нет цветовых отблесков, не учтены отраженные источники света, нет понятия преломления лучей и прочего.
VXGI позволяет решить эту проблему и максимально приблизиться к кинематографическому качеству. Суть метода заключается в разбивке геометрических фигур на воксели. При этом изначально учитывается деталировка. Проще говоря, если нам нужна картинка с максимальным качеством, то она разбивается на много вокселей. Если же результат нужен качеством похуже, то их число меньше. Если помните, была такая настройка LoD в игре Q2. Здесь приблизительно аналогично.
После чего рассчитывается количество прямого света, отражаемого вокселями. Подсчитывается информация об отраженном от поверхностей свете. Учитываются все аспекты геометрии согласно математическим формулам: тип объекта, его характеристики, отражаемость, цвет и прочее. Производится заливка цветом из учета участвующего в изображении цвета. Затем все результаты собираются, и появляется финальная картинка.
На словах все просто и элементарно. В реальности обрабатывается масса информации. Вместо слов, лучше посмотреть на работу VXGI рендера.
Как можно видеть, освещение и его отражения действительно очень похожи на то, что встречается в реальной жизни.
И пару слов о DX12. Как и предполагалось, Maxwell его поддерживает, и даже с некоторым запасом на случай добавления новых функций в API.
Аппаратные улучшения Maxwell
Эффективная работа с памятью
Еще до выхода GeForce GTX 980 было известно, что ширина шины обмена с памятью будет 256 бит. А резкие высказывания о ее недостаточности прочно засели в умах пользователей. Но ни AMD, ни NVIDIA не сидели сложа руки.
Приход 4К разрешения поставил очередную задачу перед инженерами: либо бесконечно расширять шину, что усложняет и удорожает продукт, либо наращивать частоту. И то, и другое делать крайне неэффективно, мы ведь не хотим развиваться экстенсивно, лучше, если сесть и подумать, каким образом обмануть систему.
Ранее это решение уже всплывало на поверхность и до сих пор используется. Но новые, гораздо большие нагрузки на шину делали его малоэффективным.
Третья ревизия системы компрессии позволяет достичь очень хороших результатов и существенно разгрузить шину памяти. Цвета кодируются по новому алгоритму, в несколько раз превосходящему по эффективности действующие методы. Не меньшую роль играет и используемая Maxwell кэш-память. Оба эти свойства в среднем на четверть снижают нагрузку, и 7 Гбит превращаются в эквивалентные 9.3 Гбит.
Высокая энергоэффективность
На этом пункте хотелось бы остановиться подольше, но, увы, все секреты NVIDIA не раскрывает. По заявлениям компании, тот кристалл Maxwell, что используется в GeForce GTX 970/ GTX 980, стал еще экономичнее, чем GTX 750 Ti. Заявленное номинальное значение энергопотребления старшей модели составляет всего 165 Вт.
Вполне очевидно, что одними программными методами дело не решалось. В GPU точно встроены аппаратные решения, обеспечивающие графическому ускорителю столь высокие показатели. Зато теперь без слов понятно, когда NVIDIA добавит огоньку оверклокерам, разблокировав максимальный TDP с 165 до 225 Вт.
G-Sync
Всем известно, что видеокарты не выводят изображение с постоянной частотой. В действительности, частота смены кадров на GPU постоянно меняется. Частично проблему решает VSync, но не до конца. Потому что если в момент обновления монитором изображения GPU передает два кадра, то появляется разрыв. Особенно это видно в динамичных сценах. Чтобы синхронизировать частоту GPU и монитора компания NVIDIA изобрела свой метод – G-Sync.
Минусы остались на поверхности: более дорогие мониторы и используемые в них матрицы TN. Для игроков недостатки несущественные.
реклама
Страницы материала
Лента материалов раздела
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила