Процесс развития графических процессоров немного застопорился на 28 нм техпроцессе. Отсутствие фактической возможности создать нечто новое на 16-20 нм вынуждает производителей разрабатывать более эффективные схемы.
Некоторую пищу для размышлений предоставил затронутый нами на NVIDIA Editor’s Day вопрос о времени проектирования современного GPU. Итак, срок от момента появления технического задания до воплощения задуманного в кремнии составляет не менее трех лет.
Другими словами, прошлая линейка графических процессоров NVIDIA, начиная с GK110, уже в момент пуска в серию начала перевоплощаться в существующий GM204. И работа инженеров заслуживает уважения: на неизменном техпроцессе уменьшить размер кристалла, ускорить его на 10%, снизить тепловыделение и общую стоимость – не каждому под силу.
Вопреки распространенному мнению, GM204 – это полноценный GPU без единого неактивного блока. Новую серию GeForce GTX 9xx открывают видеокарты GTX 970 и GTX 980. Существенных отличий между ними немного. Как всегда, под нож попали универсальные процессоры и скомбинированные с ними текстурные блоки. Но на этот раз разрыв возрос, с 1664 до 2048 PS.
А в описании к новым решениям NVIDIA намекнула, что GeForce GTX 970 и GTX 980 будут не единственными графическими ускорителями на ядре GM204.
| Наименование | GeForce GTX 770 |
GeForce GTX 780 |
GeForce GTX 780 Ti |
GeForce GTX 970 |
GeForce GTX 980 |
| Кодовое имя | GK104 | GK110 | GK110 | GM204 | GM204 |
| Версия | Kepler | Kepler | Kepler | Maxwell 2.x | Maxwell 2.x |
| Техпроцесс, нм | 28 | 28 | 28 | 28 | 28 |
| Размер ядра/ядер, мм2 | 294 | 521 | 521 | 398 | 398 |
| Количество транзисторов, млн | 3540 | 7100 | 7100 | 5200 | 5200 |
| Частота ядра, МГц | 1046 | 860 | 880 | 1050 | 1126 |
| Частота ядра (Turbo), МГц | 1085 | 900 | 930 | 1178 | 1216 |
| Число шейдеров (PS), шт. | 1536 | 2304 | 2880 | 1664 | 2048 |
| Число текстурных блоков (TMU), шт. | 128 | 192 | 240 | 104 | 128 |
| Число блоков растеризации (ROP), шт. | 32 | 48 | 48 | 64 | 64 |
| Максимальная скорость закраски, Гпикс/с | 33.5 | 41.4 | 42 | нд | 72 |
| Максимальная скорость выборки текстур, Гтекс/с | 133.9 | 165.7 | 210.2 | 109.2 | 144.1 |
| Тип памяти | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
| Эффективная частота памяти, МГц | 7000 | 6000 | 7000 | 7000 | 7000 |
| Объем памяти, Гбайт | 4 | 3 | 3 | 4 | 4 |
| Шина памяти, бит | 256 | 384 | 384 | 256 | 256 |
| Пропускная способность памяти, Гбайт/с | 224.3 | 288.4 | 336 | 224.3 | 224.3 |
| Питание, pin | 6+8 | 6+8 | 6+8 | 6+6 | 6+6 |
| Потребляемая мощность (2D / 3D), Ватт | -/230 | -/250 | -/250 | -/145 | -/165 |
| CrossFire/Sli | V | V | V | V | V |
| Рекомендованная цена, $ | 349 | 499 | 699 | 299 | 549 |
| Заменяемая модель | GTX 670 | GTX 680 | GTX 780 | GTX 770/ GTX 780 |
GTX 780 Ti |
Каких-то глобальных изменений внутри организации GPU не произошло. Графический процессор GM204 состоит из четырех GPC, каждый из которых в свою очередь состоит из четырех SMM. Объем кэш-памяти остался прежним – 2 Мбайта.
Радикально изменилось число блоков растеризации, которые осуществляют операции записи пикселей в буферы и их смешивания. Они понадобились в таком количестве из-за возросших разрешений и активного использования фильтров постобработки и антиалиасинга. Чуть-чуть увеличился объем кэш-памяти в SMM – с 64 до 96 Кбайт.
На диаграмму не попали блоки вычислений DP – четыре штуки на один SMM. На самом деле GM204 чисто игровое решение, и скорость выполнения такого рода задач не особенно важна, хотя, с другой стороны, любители GPGPU-вычислений будут не рады.
История в картинках: развитие архитектур NVIDIA.
Она позволяет достичь качества разрешения 4К на мониторах с разрешением 1080Р. Ранее мы видели аналогичную технологию, но под названием SuperSampling. В этот раз в NVIDIA пошли дальше.
DSR – это даже не разновидность SS, а способ умно применить фильтр Gaussian. Вроде бы что-то похожее нам уже встречалось, но теперь качество действительно максимально приближено к 4К разрешениям. Посмотрим на классический пример работы GPU.
Для начала берется геометрическая фигура, разбивается на пиксели и закрашивается (это очень упрощенная схема). В случае с DSR рендер происходит в 4К разрешении, из-за чего используется в четыре раза больше пикселей, но для того чтобы не было эффекта слишком большой резкости, к получаемому изображению применяется фильтр.
В итоге картинка получается четкой с большим количеством деталей, но при этом без чрезмерной резкости.
Естественно, что DSR не появится в настройках старых игр, придется ставить утилиту GeForce Experience и активировать ее. Причем уровень размытия фильтром будет настраиваемым, равно как и эффективное разрешение (от 1.2Х до 4Х).
Существующий сэмплинг MSAA достаточно красивый, но уж слишком трудозатратный. Особенно, если речь идет о 4х. Новый тип фильтра призван достичь, как минимум, не худшего эффекта.
Четырехкратная выборка позволяет достичь практически идеального изображения, но что делать, если ресурсов не хватает? Тогда можно воспользоваться двумя соседними кадрами с двукратной выборкой, оставляя данные по ней в буфере.
Затраты снижаются в два раза, а результат не хуже, чем с 4хMSAA. Все потому, что соблюдаются условия, идентичные 4xMSAA. Пока же режим MFAA только должен появиться в драйверах, и проверить заявление мы не можем. В среднем разница между 4xMSAA и 4xMFAA достигает 30%, естественно в пользу MFAA.
Пожалуй, наиболее интересное нововведение, которое появилось в Maxwell. Обычное освещение, отображаемое в играх, мало соответствуют реальному. Нет цветовых отблесков, не учтены отраженные источники света, нет понятия преломления лучей и прочего.
VXGI позволяет решить эту проблему и максимально приблизиться к кинематографическому качеству. Суть метода заключается в разбивке геометрических фигур на воксели. При этом изначально учитывается деталировка. Проще говоря, если нам нужна картинка с максимальным качеством, то она разбивается на много вокселей. Если же результат нужен качеством похуже, то их число меньше. Если помните, была такая настройка LoD в игре Q2. Здесь приблизительно аналогично.
После чего рассчитывается количество прямого света, отражаемого вокселями. Подсчитывается информация об отраженном от поверхностей свете. Учитываются все аспекты геометрии согласно математическим формулам: тип объекта, его характеристики, отражаемость, цвет и прочее. Производится заливка цветом из учета участвующего в изображении цвета. Затем все результаты собираются, и появляется финальная картинка.
На словах все просто и элементарно. В реальности обрабатывается масса информации. Вместо слов, лучше посмотреть на работу VXGI рендера.
Как можно видеть, освещение и его отражения действительно очень похожи на то, что встречается в реальной жизни.
И пару слов о DX12. Как и предполагалось, Maxwell его поддерживает, и даже с некоторым запасом на случай добавления новых функций в API.
Еще до выхода GeForce GTX 980 было известно, что ширина шины обмена с памятью будет 256 бит. А резкие высказывания о ее недостаточности прочно засели в умах пользователей. Но ни AMD, ни NVIDIA не сидели сложа руки.
Приход 4К разрешения поставил очередную задачу перед инженерами: либо бесконечно расширять шину, что усложняет и удорожает продукт, либо наращивать частоту. И то, и другое делать крайне неэффективно, мы ведь не хотим развиваться экстенсивно, лучше, если сесть и подумать, каким образом обмануть систему.
Ранее это решение уже всплывало на поверхность и до сих пор используется. Но новые, гораздо большие нагрузки на шину делали его малоэффективным.
Третья ревизия системы компрессии позволяет достичь очень хороших результатов и существенно разгрузить шину памяти. Цвета кодируются по новому алгоритму, в несколько раз превосходящему по эффективности действующие методы. Не меньшую роль играет и используемая Maxwell кэш-память. Оба эти свойства в среднем на четверть снижают нагрузку, и 7 Гбит превращаются в эквивалентные 9.3 Гбит.
На этом пункте хотелось бы остановиться подольше, но, увы, все секреты NVIDIA не раскрывает. По заявлениям компании, тот кристалл Maxwell, что используется в GeForce GTX 970/ GTX 980, стал еще экономичнее, чем GTX 750 Ti. Заявленное номинальное значение энергопотребления старшей модели составляет всего 165 Вт.
Вполне очевидно, что одними программными методами дело не решалось. В GPU точно встроены аппаратные решения, обеспечивающие графическому ускорителю столь высокие показатели. Зато теперь без слов понятно, когда NVIDIA добавит огоньку оверклокерам, разблокировав максимальный TDP с 165 до 225 Вт.
Всем известно, что видеокарты не выводят изображение с постоянной частотой. В действительности, частота смены кадров на GPU постоянно меняется. Частично проблему решает VSync, но не до конца. Потому что если в момент обновления монитором изображения GPU передает два кадра, то появляется разрыв. Особенно это видно в динамичных сценах. Чтобы синхронизировать частоту GPU и монитора компания NVIDIA изобрела свой метод – G-Sync.
Минусы остались на поверхности: более дорогие мониторы и используемые в них матрицы TN. Для игроков недостатки несущественные.
| Модель | A, мм |
B, мм |
C, мм |
D, мм |
A1, мм |
B1, мм |
C1, мм |
| NVIDIA GeForce GTX 970/ GTX 980 | 267 | 98 | 36 | 64 | 267 | 98 | 40 |
| NVIDIA GeForce GTX 770 | 267 | 98 | 36 | 64 | 267 | 98 | 40 |
| NVIDIA GeForce GTX 780/ GTX 780 Ti/ GTX Titan/ GTX Titan Black |
267 | 98 | 36 | 64 | 267 | 98 | 40 |
| AMD Radeon R9 290X/ R9 290 | 267 | 98 | 34 | 71 | 275 | 98 | 39 |
А – длина печатной платы, без учета системы охлаждения и планки портов видеовыходов.
В – ширина печатной платы, без учета контактов PCI-E и системы охлаждения.
С – высота от горизонтальной плоскости печатной платы до уровня верхней поверхности системы охлаждения.
D – диаметр вентилятора/ов по внешнему радиусу.
А1 – длина печатной платы, с учетом системы охлаждения (если выходит за пределы печатной платы) до планки портов видеовыходов.
В1 – ширина печатной платы, без учета контактов PCI-E, но с замером системы охлаждения (если выходит за пределы печатной платы).
С1 – высота, с учетом задней пластины (если есть)/винтов крепления радиатора до уровня верхней поверхности системы охлаждения. Если она ниже высоты задней планки портов видеовыходов, то измеряется высота до верхней точки планки.
Эталонная печатная плата сохранила поддержку мультиграфических конфигураций через отдельные мостики. NVIDIA не верит в пропускную способность интерфейса PCI-e 3.0? Зато мы наконец-то получили пять видеовыходов и четыре из них независимые!
Причем расположены они идеально, DVI порт отделен от остальных. Интересно, зачем было смешивать DisplayPort и HDMI? Для услады перфекционистов их стоило бы выстроить по порядку
Со времени появления GeForce GTX 770 и GTX 780 печатная плата изменилась мало. Разработчики сохранили общее размещение компонентов.
В частности, GTX 980 представляет собой комбинированное решение из PCB GTX 770 и GTX 780. Место, ранее занимаемое 8pin питанием, вряд ли когда-нибудь будет использовано. Слишком уж энергоэффективным оказался новый GPU.
ШИМ-контроллер – до боли знакомый нам NCP 81174. Он поддерживает управление четырьмя фазами питания, которыми GTX 980 и оснащен. Сам контроллер сменный и впаян в легко заменяемую мини-печатную плату. Это стало традицией для NVIDIA. Благодаря этому платы легко менять, оснащая их более продвинутыми контроллерами в случае установки большего числа фаз. А места под них как раз предостаточно. Если задействовать два пустых места, то видеокарту легко оснастить шестифазным питанием. Еще одна фаза питает память.
Кстати о памяти. Все восемь микросхем распаяны спереди и охлаждаются единой пластиной-радиатором.
А логотип видеокарты, как и полагается, светится.
NVIDIA не стала кардинально перерабатывать прежнюю конструкцию. Существующие системы охлаждения, оставшиеся со времен проектирования GTX 770/ GTX 780, отлично подошли новому однопроцессорному флагману.
Разве что инженеры немного изменили кожух, чтобы он полностью закрывал порты видеовыходов.
Под кожухом установлена пластина-радиатор, охлаждающая микросхемы памяти и силовые цепи. А после снятия СО можно отметить, что основный радиатор уже не использует испарительную камеру. Хотя бы потому, что GM204 достаточно «прохладный» процессор.
Внутри радиатора расположены три тепловые трубки. Сверху по периметру наклеены специальные вставки, предотвращающие передачу вибраций и воздуха мимо радиатора.
Неплохо была продумана и тыльная часть системы охлаждения.
Поскольку радиатор перекрывает доступ воздуха к соседней видеокарте, то возле разъемов питания снимается заглушка, после чего освобождается небольшое пространство для забора воздуха.
В целом ничего нового в материальной части системы охлаждения не произошло. Она продолжает переходить от одной видеокарты к другой с небольшими корректировками.
Тестирование видеокарты NVIDIA GeForce GTX 980 проходило в составе следующей конфигурации:
Перечень используемых контрольно-измерительных приборов и инструментов
Для корректного замера температуры и шума использовались приведенные ниже условия. Помещение, внутри которого располагается система автоматической поддержки климатических условий. В данном случае уровень температуры был установлен на отметке 24°C +/-1°C. За точностью соблюдения заданных параметров наблюдало четыре датчика, один из которых находился в 5 см от вентилятора системы охлаждения видеокарты и был ведущим. По нему происходила основная коррекция температуры в помещении.
Шум измерялся на расстоянии 50 см до видеокарты. Фоновый уровень составлял <20 дБА. На стенде отсутствовали иные комплектующие, издающие какие-либо шумы.
Видеозапись системы охлаждения производилась на расстоянии ~10 см от вентилятора. Первые 5-10 секунд без нагрузки в режиме простоя, далее включалась 100% нагрузка с помощью программы Unigine Heaven Benchmark v4.0. Наибольший уровень шума достигается в конце аудиозаписи. Заранее определялся температурный режим и шум, чтобы в процессе записи аудиодорожки вы смогли услышать именно максимальный шум. В процессе просмотра видеороликов можно выделить тембр и характер звуков, издаваемых системой охлаждения. Предупреждаю вас, что звук на них сильно приукрашен, то есть ощущается сильнее, чем есть на самом деле.
Уровень потребления электричества в простое оценивался по показаниям тарификатора E305EMG сразу после загрузки операционной системы. Значения, отображаемые на графике, соответствуют минимально достигнутым цифрам с прибора. Под нагрузкой видеокарты тестировались программой Unigine Heaven Benchmark v4.0. После 10-15 минут температура и обороты вентилятора достигали своего теоретического максимума, после чего данные заносились в таблицу.
Температура силовых цепей измерялась путем установки термодатчика в пространство между радиатором и термопрокладкой в самое нагруженное место.
Нюансы, возникшие в процессе тестирования, я постараюсь подробно объяснить по мере их возникновения.
В части игр, где это возможно, использовались встроенные отрезки теста, при необходимости тестирование дополнялось результатами утилиты FRAPS v3.5.99.
Список тестовых приложений:
VSync при проведении тестов был отключен.
Для корректного сравнения необходимо прослушивать все видеозаписи на одном уровне громкости. Сравнение относительное, а не абсолютное.
Температура графического ядра.
Все предыдущие решения NVIDIA при проверке на максимальный нагрев требовали выключения защиты по температуре. GeForce GTX 980 оказалась из другой оперы, ей не нужны эти действия. Лишь при совсем низких оборотах вентилятора срабатывает принудительная защита от перегрева.
Шумовые показатели – это отражение борьбы за энергоэффективность. Чем меньше потребляет энергии GPU, тем меньше он нагревается и тем тише можно заставить работать систему охлаждения. Что NVIDIA и сделала.
Шаг настолько большой, что при сравнении с аналогичными видеокартами референсного дизайна, GeForce GTX 980 стоит особняком. Увы, измерить температуру силовой части моими средствами не удалось. Компоновка настолько плотная, что щуп термодатчика не помещается между радиаторов.
Номинальное энергопотребление GeForce GTX 980 равно 165-170 Вт, в BIOS прописан абсолютный лимит 225 Вт. До этого значения у вас есть множество способов разогнать GPU. Либо простым повышением частоты и GPU Boost автоматически поднимет напряжение, либо все сделать ручками.
В данном случае напряжение поднято на +0.09 В, итоговое составило 1.26 В, что дало возможность GPU заработать на частоте 1.4 ГГц. Стоит отметить, что впервые флагман разгоняется на воздухе до такой величины. Не подвела и память, осилив частоту 1950 МГц.
Видеокарта при этом не перегревалась, а температура не поднималась выше 81°C. Особенно разительно выглядят сухие цифры на графиках, если сравнивать GeForce GTX 980 с конкурентами.
Частота GPU.
Напряжение GPU.
Температура GPU.
Обороты вентилятора.
А что происходит в разгоне?
Частота практически постоянно держится в диапазоне 1380-1400 МГц. Сложная сцена Metro Last Light в максимальном качестве максимально загрузила графический процессор и систему питания видеокарты.
Напряжение, в сравнении с ранее побывавшими у нас видеокартами NVIDIA и AMD, очень стабильно. GPU Boost постоянно поддерживает заданное значение.
В плане энергопотребления GeForce GTX 980, как никто ранее, продемонстрировала потрясающие возможности. 170 Вт в номинальном режиме работы и 220 Вт в разгоне. И это с учетом производительности новой видеокарты!
| Название | Номинальные частоты GPU/Mem, МГц |
Разгон GPU/Mem, МГц |
| GeForce GTX Titan Black | 890-980/1750 | 1225/1850 |
| GeForce GTX Titan | 840-880/1500 | 1200/1550 |
| GeForce GTX 780 Ti | 880-930/1750 | 1250/1800 |
| GeForce GTX 780 | 863-900/1500 | 1200/1550 |
| GeForce GTX 770 | 1046-1085/1750 | 1250/1800 |
| GeForce GTX 760 | 980-1033/1500 | 1200/1700 |
| GeForce GTX 980 | 1126-1216/1750 | 1400/1950 |
| Radeon R9 290X | 1000/1250 | 1150/1450 |
| Radeon R9 290 | 950/1250 | 1150/1450 |
| Radeon R9 280X | 1000-1050/1500 | 1150/1700 |
| Radeon R9 285 | 920/1375 | 1100/1600 |
| Radeon R9 280 | 850-933/1250 | 1150/1600 |
| Radeon R9 270X | 1050/1400 | 1150/1600 |
| Radeon R9 270 | 925/1400 | 1100/1600 |
Настройки:
Настройки:
Настройки:
Настройки:
Настройки:
Настройки:
Настройки:
Настройки:
Версия – последняя на момент тестирования, с обновлениями Origin.
Настройки:
Легче всего сравнить средние результаты по итогам двух разрешений в процентном соотношении. Для этого по горизонтали отложите требуемую видеокарту, а по вертикали определите сравниваемую модель. На пересечении получите процентную разницу между ними.
Среднее количество кадров в секунду и их стоимость
Средний FPS | Стоимость 1 средн. к/сЧтобы понять, какую производительность считать приемлемой, стоит выяснить, на что необходимо обращать внимание. Стендовый набор игр и настроек выбран с учетом корректности сравнения всех участников, от начальных моделей до самых дорогих.
Условно степень сложности отрисовки сцен в играх можно разделить на:
Данный тест проводился со следующими настройками качества: «Среднее максимальное» и «Максимальное». Чем выше качество, тем в большей степени результат зависит от видеокарты, а не от системы в целом.
По этой причине даже 30 кадров в секунду условно можно считать минимальным порогом для вхождения в группу видеокарт, подходящих для большинства игр. В конце концов, для нормальных показателей достаточно сделать несколько движений и снизить качество.
Еще один важный момент с моей точки зрения – показатель соотношения цены к скорости, чем он ниже, тем дешевле обойдется производительность графической подсистемы в играх. Но при этом не стоит забывать и о среднем количестве кадров в секунду.
Итак, по результатам тестирования NVIDIA GeForce GTX 980 можно сказать, что это самая:
Есть ли хотя бы один пункт, на котором могла проколоться новинка калифорнийской компании? К счастью для фанатов NVIDIA – нет. И к несчастью для оппонента, она слишком хороша, чтобы быть реальностью.
К сожалению, текущий конкурент Radeon R9 290X проигрывает по всем пунктам. Единственное, за что его можно похвалить, так это за постоянно снижающуюся цену. Дело дошло до того, что NVIDIA выпуском GeForce GTX 980 перестала брать его во внимание и начала создавать внутреннюю конкуренцию своим же продуктам (GTX 780/ GTX 780Ti). По этой причине они и снимаются с данного момента с производства. А мы ждем в гости GTX 970, а за ней, возможно, последуют и другие модели на обновленном Maxwell.
P.S. В честь выпуска старшей видеокарты Maxwell компания организовывает онлайн-трансляцию, на которой можно выиграть ценные призы.
Выражаем благодарность за помощь в подготовке материала: