Вот и настал тот момент, когда компания Nvidia решилась на показ долгожданного обновления графических ускорителей игрового диапазона. В новую линейку пока вошли три модели: GeForce RTX 2070, GeForce RTX 2080 и GeForce RTX 2080 Ti. Все они построены на новом ядре Turing, потенциал которого еще надо раскрыть.
История развития компьютерной графики весьма линейна. Любое отклонение от курса вызывает множество вопросов и обычно не получает должного внимания. Но существует несколько граничных переходов, о которых вы и так знаете. Однако далеко от традиционной модели построения кадра никто не отходит и тут за кадром остается важный вопрос, а долго ли эта модель будет способна развивать саму себя?
Ведь не первый год разработчики бьются со стагнацией производительности ЦП, который сильно влияет на загрузку графического ядра. К этому делу подключается Microsoft, обновляя DirectX, но уже сейчас мы сталкиваемся с сильным дисбалансом между техническими возможностями видеокарты и остальной системы. Можно даже представить себе или, лучше сказать, выдумать модель, где центральный процессор будет заменен иным инструментом и не станет слабым звеном. В таком случае текущий прогресс графики был бы заметен сильнее, но, увы, пока это нереализуемо.
А раз остальные, мягко говоря, тормозят, то разработчикам Nvidia пришлось пойти на риск. Будет ли он оправдан, покажет время.
Таким образом мы плавно подошли к выводу, что менять весь алгоритм отрисовки кадра никто не собирается, важнее немного сменить курс, но безболезненно и не радикально, чтобы можно было улучшить качество в играх, но не терять связь с прошлым. И тем самым минимизировать риски перехода.
Здесь на сцену выходят аппаратные решения, такие как тензорные ядра и RT-ядра. Последние отвечают за аппаратное ускорение трассировки лучей, а первые выполняют задачи с применением искусственного интеллекта. Оба решения – звенья одной цепочки и занимают немалую часть площади GPU. Однако без них невозможен переход на следующую ступень эволюции. Да, именно эволюционный способ развития, а не революционный, сейчас выбирают многие компании. Как уже писалось выше: риски слишком велики!
Тем не менее, отныне Nvidia вполне официально может гордиться, что привнесла в игровой процесс комбинированную систему рендеринга кадра, когда традиционные методы совмещаются с трассировкой лучей для обработки отражающих поверхностей и теней.
Пока это всего лишь базовые функции (тени, глобальное освещение, отражения), а в скором времени в новых играх появятся и более продвинутые и насыщенные элементы декорации кадра.
Вторым элементом, впервые появившимся в GPU игрового класса, стали RT-ядра. Их мы уже видели в Nvidia Titan V, но данная видеокарта далека от народа. А RT-ядра понадобились для нескольких целей: первая – новый метод сглаживания DLSS с ИИ, вторая – помощь при обработке кадра, использующего трассировку лучей (а точнее, наложение фильтров шумоподавления).
Все это выглядит убедительно на бумаге и в тексте, но первые результаты производительности все равно будут наложены на классический рендер в уже существующих играх, поэтому делать выводы пока рано. А чтобы оценить нововведения в Turing, мы кратко расскажем о них.
Несомненно, существующие методы сглаживания требуют слишком большой производительности, либо используют всевозможные хаки и ухищрения, дабы снизить нагрузку, но в ущерб качеству. DLSS – это очередной метод, но отличающийся от всех остальных благодаря наличию тензорных ядер. Это относительно простые вычислительные блоки, которые работают с операциями FMA.
Но их роль в DLSS по-прежнему носит эпизодический характер, ведь выполнить всю работу они не в состоянии. Поэтому сервера Nvidia обрабатывают кадры из игр, создавая готовый профиль, которым игроки воспользуются в дальнейшем. Благодаря этому такой тип сглаживания отнимает меньше ресурсов, но по качеству очень близок к идеальному решению. Естественно, для пользователя будет доступно несколько глубин сглаживания, но все они дают действительно потрясающий результат.
Новая модель для построения и управления всей геометрией, вершинами, тесселяцией и многим другим. Идея родилась достаточно давно, но на реализацию потребовалось время. Это один из способов решения проблемы узкого места системы построения кадра – CPU.
В альтернативной ветке Nvidia предлагает использовать Mesh Shading, дабы максимально исключить CPU и задержки на draw calls. Благодаря ему вершинный конвейер заменяется аналогом вычислительных шейдеров для геометрии.
Но пока это решение остается доступным только через специальный NVAPI. Однако, со слов Nvidia, компания Microsoft готова внедрить его в ближайшем будущем.
Еще одна возможность для разработчиков повысить производительность в играх благодаря шейдингу с переменным количеством сэмплов. Совсем просто: на одном кадре благодаря оптимизациям время отрисовки без видимого ухудшения картинки снижается на 20-35%. Суть схемы проста: VRS оперирует участками 4 х 4 пикселя, задавая им различное количество сэмплов закраски.
И вроде бы на этой ноте надо продолжить рассказ о технических характеристиках, но я бы хотел остановиться вот на чем! Все технологии проходят два пути развития: становление и забвение.
За богатую историю 3D мы повидали немало анонсов, обещающих сверхъестественное качество, реализм и погружение, но часть из них благополучно исчезла с рынка, а другой пришлось долго и муторно пробивать себе дорогу на Олимп. Вспомнить хотя бы компанию S3 с видеокартой S3 Virge, в которой был представлен аппаратный блок 3D. Ох и давно это было, а пик популярности и расцвета пришелся только через пять лет. Или полноэкранное сглаживание 3Dfx. Да и ATi с тесселяцией стрельнула не сразу. Поэтому делать выводы о благополучии или утопичности новых технологий пока рано. А сейчас самое время вернуться к характеристикам GPU Turing.
Более подробное описание архитектуры можно прочесть тут.
| Название | Трассировка лучей |
DLSS сглаживание |
Turing Advanced Shading |
| Ark: Survival Evolved | V | ||
| Assetto Corsa Competizione | V | ||
| Atomic Heart | V | V | |
| Battlefield V | V | ||
| Control | V | ||
| Dauntless | V | ||
| Darksiders III | V | ||
| Deliver Us The Moon: Fortuna | V | ||
| Enlisted | V | ||
| Fear The Wolves | V | ||
| Final Fantasy XV | V | ||
| Fractured Lands | V | ||
| Hellblade: Senua's Sacrifice | V | ||
| Hitman 2 | V | ||
| In Death | V | ||
| Islands of Nyne | V | ||
| Justice | V | V | |
| JX3 | V | V | |
| KINETIK | V | ||
| MechWarrior 5: Mercenaries | V | V | |
| Metro Exodus | V | ||
| Outpost Zero | V | ||
| Overkill's The Walking Dead | V | ||
| PlayerUnknown Battlegrounds | V | ||
| ProjectDH | V | ||
| Remnant: From the Ashes | V | ||
| SCUM | V | ||
| Serious Sam 4: Planet Badass | V | ||
| Shadow of the Tomb Raider | V | ||
| Stormdivers | V | ||
| The Forge Arena | V | ||
| We Happy Few | V | ||
| Wolfenstein II | V |
| Наименование | GeForce GTX 980 Ti | GeForce GTX 1080 Ti | GeForce RTX 2080 Ti |
| Кодовое имя | GM200 | GP102 | TU102 |
| Версия | Maxwell 2.x | Pascal | Turing |
| Техпроцесс, нм | 28 | 16 | 12 |
| Размер ядра/ядер, мм2 | 601 | 471 | 574 |
| Количество транзисторов, млн | 8000 | 12000 | 18600 |
| Частота ядра, МГц | 1000 | 1480 | 1350 |
| Частота ядра (Turbo), МГц | 1075 | 1582 | 1635 |
| Число шейдеров (PS), шт. | 2816 | 3584 | 4352 |
| Число текстурных блоков (TMU), шт. | 176 | 224 | 272 |
| Число блоков растеризации (ROP), шт. | 96 | 88 | 88 |
| Максимальная скорость выборки текстур, Гтекс/с | 176 | 331.5 | 444.7 |
| Тип памяти | GDDR5 | GDDR5X | GDDR6 |
| Эффективная частота памяти, МГц | 1750 | 2750 | 3500 |
| Объем памяти, Гбайт | 6 | 11 | 11 |
| Шина памяти, бит | 384 | 352 | 352 |
| Пропускная способность памяти, Гбайт/с | 336.5 | 484 | 616 |
| Питание, разъемы Pin | 6 + 8 | 6 + 8 | 8 + 8 |
| Потребляемая мощность (2D/3D), Ватт | -/250 | -/250 | -/260 |
| CrossFire/Sli | V | V | V |
| Рекомендованная цена при анонсе, $ | 649 | 649 | 999-1199 |
| Модель | A, мм |
B, мм |
C, мм |
D, мм |
A1, мм |
B1, мм |
C1, мм |
| Nvidia GeForce RTX 2080 Ti | 267 | 100 | - | 85 | 267 | 100 | 39 |
А – длина печатной платы, без учета системы охлаждения и планки портов видеовыходов.
В – ширина печатной платы, без учета контактов PCI-E и системы охлаждения.
С – высота от горизонтальной плоскости печатной платы до уровня верхней поверхности системы охлаждения.
D – диаметр вентилятора/ов по внешнему радиусу.
А1 – длина печатной платы, с учетом системы охлаждения (если выходит за пределы печатной платы) до планки портов видеовыходов.
В1 – ширина печатной платы, без учета контактов PCI-E, но с замером системы охлаждения (если выходит за пределы печатной платы).
С1 – высота, с учетом задней пластины (если есть)/винтов крепления радиатора до уровня верхней поверхности системы охлаждения.
Конфигурация портов претерпела изменения. Модели GeForce RTX 2080 Ti и GeForce RTX 2080 Founders Edition комплектуются тремя DisplayPort 1.4a, поддерживающими мониторы с разрешением до 8K при 60 Гц, разъемом HDMI 2.0b с поддержкой HDCP 2.2 и одним портом USB Type-C для подключения любого совместимого оборудования, вплоть до жесткого диска. Причем питание подается согласно спецификациям.
К сожалению, видеокарта не разбиралась вследствие дальнейшей передачи в Nvidia, дабы не портить внешний вид и состав термопасты. Согласно заверению специалистов компании, в текущей версии печатной платы используется 13-фазовая iMON DrMOS система питания для графического процессора и три фазы питания для памяти стандарта GDDR6.
Благодаря этому максимальный уровень TDP поднялся до 260 Вт, а питается видеокарта от двух разъемов 8 pin. Штатные режимы работы GeForce RTX 2080 Ti: видеоядро – 1350 МГц (Boost – 1635 МГц), память – 1750 МГц.
Применявшаяся ранее эталонная конструкция системы охлаждения поменялась полностью. Увеличилась площадь радиатора, как следствие, из-за размеров испарительной камеры возрос КПД всей системы. Теперь вместо турбины установлена пара вентиляторов, а масса видеокарты существенно увеличилась.
Но все это в свою очередь сделало возможным повысить уровень акустического комфорта. Штатные обороты вентиляторов снизились, а выигрыш в средней температуре достиг 10°C.
Конфигурация:
Программное обеспечение:
Перечень контрольно-измерительных приборов и инструментов:
Для корректного замера температуры и шума использовались приведенные ниже условия. Помещение, внутри которого располагается система автоматической поддержки климатических условий. В данном случае уровень температуры был установлен на отметке 24°C +/-1°C. За точностью соблюдения заданных параметров наблюдало четыре датчика, один из которых находился в 5 см от вентилятора системы охлаждения видеокарты и был ведущим. По нему происходила основная коррекция температуры в помещении.
Шум измерялся на расстоянии 50 см до видеокарты. Фоновый уровень составлял менее 20 дБА. В качестве жесткого диска использовался SSD, а блок питания, помпа и радиатор с вентиляторами во время замера находились за пределами комнаты. На стенде отсутствовали иные комплектующие, издающие какие-либо шумы.
Уровень потребления электричества в играх оценивался специальным приспособлением по обеим линиям 8 pin и шине PCI-e. Под нагрузкой видеокарты тестировались программой Unigine Heaven Benchmark v4.0. После 10-15 минут температура и обороты вентиляторов достигали своего теоретического максимума, после чего данные заносились в таблицу.
В части игр, где это возможно, использовались встроенные отрезки теста, при необходимости тестирование дополнялось результатами утилиты Fraps v3.5.99. Для данного теста мы полностью пересмотрели уровень качества в играх для видеокарт топ-класса. Теперь в игровых приложениях выставляются максимальные настройки, а сами тесты проходили в трех разрешениях: 1920 х 1080, 2560 х 1440 и 3840 х 2160 (4K).
VSync при проведении тестов был отключен.
Пояснения к графикам:
В процентах указана скорость вентилятора/ов, выставленная в MSI Afterburner, начиная от 0% до 100%, с шагом 5%. Таким образом, чтобы понять, насколько нагреется видеокарта, и как сильно она будет шуметь, скажем, при 50% скорости вентилятора, достаточно провести вертикальную линию через отметку 50%. В местах пересечения получаем три значения: с красной линией – максимальную температуру в нагрузке, с синей линией – температуру в простое, с черной линией – уровень шума.
Все видеокарты тестировались с заводскими частотами. Учтите, что звукозапись в видеоматериалах приукрашает уровень шума.
Температуры графического ядра и обороты вентилятора/ов.
Nvidia GeForce GTX 1080 Ti:
Nvidia GeForce RTX 2080 Ti:
За счет новой конструкции с двумя вентиляторами достигнут колоссальный прогресс, особенно это чувствуется под нагрузкой. Преимущество GeForce RTX 2080 Ti доходит до 15 градусов Цельсия при схожем уровне шума.
С добавлением обновленной версии (четвертой по счету) GPU Boost разгон графического процессора превратился в автоматизированную операцию. Теперь весь процесс проходит самостоятельно, а от пользователя практически не требуется никаких знаний.
И поскольку кривая с промежуточными частотами ныне содержит больше ступеней, то для адаптивного и правильного разгона нужно двигать ее на всем протяжении, и делать это вручную – занятие не для слабонервных. Среди прочих изменений – появился инструмент сканирования стабильных частот.
Включаете его и смело идете пить чай или кофе. Алгоритм настолько продвинутый, что для точного определения позиции новых точек требуется около 20 минут. По завершении процесса вам продемонстрируют новые значения на экране.
С другой стороны, разгон пока никак не влияет на память; точнее, ее по-прежнему приходится разгонять вручную.
Остаются вопросы и к расширенному уровню TDP – использует ли его алгоритм или нет. Судя по результатам, добавление 23% к номинальному значению приводит к чуть более высоким показателям. В целом же разгон видеокарты типичен и позволяет ориентироваться на стабильные ~2 ГГц под любой нагрузкой.
Для оценки поведения видеокарты в номинальном режиме работы обратимся к более чем часовому тесту стабильности 3DMark, параллельно соберем данные с графического ядра, а также значения частот памяти, энергопотребления и температур. Объединяем полученные данные в единые графики и видим, насколько точно соответствуют заводские характеристики реальным цифрам, и что происходит с важными показателями при разгоне.
Частота ядра:
Обе видеокарты получили похожие настройки. Главным ограничителем частоты графического ядра выступает энергопотребление. На бумаге у GeForce GTX 1080 Ti штатная настройка – 250 Вт. Для GeForce RTX 2080 Ti лимит TDP составляет 260 Вт. Но в рукаве Turing – более эффективная система охлаждения. Впрочем, уровень TDP остается единственным фактором, не позволяющим новинке разгоняться автоматически выше 18хх МГц. Как только диапазон TDP расширяется до 123%, GPU Boost мгновенно задействует кусочек свободы, поднимая частоту вплотную к 2 ГГц.
Отметим приличный запас по частоте памяти GeForce RTX 2080 Ti. Без каких-либо проблем со стабильностью ее эффективную частоту удалось поднять до 8 ГГц; для сравнения – микросхемы GDDR5X на GeForce GTX 1080 Ti достигли лишь 5.8 ГГц.
Напряжение vGPU:
Каким же образом Nvidia смогла втиснуть 18 млрд транзисторов в 260 Вт? Это было сделано путем нахождения компромисса между частотой и энергопотреблением. В заводском виде GeForce RTX 2080 Ti едва задействует напряжение выше 1 В, представьте себе силы тока, проходящие через систему питания! Даже в разгоне мы только приблизились к постоянному напряжению 1 В, но так его и не превысили.
Температура GPU:
Столь крупный графический процессор с высокой частотой должен изрядно нагреваться. Но увеличенная и улучшенная СО справляется с этим превосходно. Увы, вытекающий отсюда недостаток в виде пары вентиляторов, работающих в простое, приводит к повышенному уровню шума. С другой стороны, интересен сравнительный анализ: предыдущая СО была в простое тише, а новая под нагрузкой хоть и шумит на те же 39 дБА, но характер звучания у нее приятнее.
Обороты вентиляторов:
Наглядная демонстрация улучшений в системе питания и охлаждения. Теперь игровой флагман Nvidia нового поколения не только прохладнее, но и поддерживает более низкую температуру за счет меньших оборотов вентиляторов.
Энергопотребление:
GeForce RTX 2080 Ti во всех смыслах прожорливее GeForce GTX 1080 Ti, однако регулятор на ней работает точнее. В среднем разница между видеокартами полностью совпадает с паспортными значениями – около 10-15 Вт.
| Модель | Частота, МГц |
Разгон, МГц |
| Radeon RX Vega 64 | 1406/950 | 1600/1000 |
| GeForce RTX 2080 Ti | 1350/1750 | 1970/2000 |
| GeForce GTX 1080 Ti | 1480/1376 | 1870/1450 |
| GeForce GTX 1080 | 1607/1251 | 1925/1300 |
Версия – последняя на момент тестирования, с обновлениями Origin.
Настройки:
Версия – последняя на момент тестирования, с обновлениями Origin.
Настройки:
Настройки:
Настройки:
Настройки:
Настройки:
Настройки:
Настройки:
Настройки:
Настройки:
Настройки:
Настройки:
Среднее количество кадров
| Модель | Среднее, 1920 x 1080 |
Среднее, 2560 х 1440 |
Среднее, 3840 x 2160 |
| Radeon RX Vega 64 | 112.2 | 81.5 | 45.5 |
| GeForce RTX 2080 Ti | 157.7 | 135.5 | 81.9 |
| GeForce GTX 1080 Ti | 145.4 | 111.5 | 62.7 |
| GeForce GTX 1080 | 119.1 | 83.7 | 47.4 |
| Radeon RX Vega 64 OC | 119.3 | 88.8 | 50.1 |
| GeForce RTX 2080 Ti OC | 163.5 | 144.2 | 90.3 |
| GeForce GTX 1080 Ti OC | 148.9 | 118.1 | 67.7 |
| GeForce GTX 1080 OC | 126.1 | 90.4 | 50.4 |
В зависимости от нагрузки преимущество GeForce RTX 2080 Ti над GeForce GTX 1080 Ti составляет от 8 до 30%, да и в разгоне ситуация схожая. Видимо, это фиаско? Или стоит переосмыслить написанное? Помните, речь шла о технологиях, так вот и ответ, на что потрачен транзисторный бюджет – на будущее! Реализовать все достоинства Turing в традиционных играх и при низком разрешении физически невозможно.
Если проще, то в Full HD якорем выступает процессор, который заставляет простаивать GPU часть времени, а в высоком разрешении в тестовом наборе игр пока недоступны основные фишки ядра Turing. Ждем новинок с поддержкой и запасаемся попкорном, ведь это не последняя наша встреча с архитектурой Turing.
Впрочем, данный тест не был бы объективным, если бы мы не воспользовались ситуацией и не протестировали технологии DLAA и RTX в играх, которые уже доступны нам, обозревателям, чтобы точнее донести смысл нововведений Nvidia.
Сравнительные результаты в 4К разрешении:
| TAA | DLAA | |
| Среднее количество кадров в секунду | 42.9 | 58.4 |
| Минимальное количество кадров в секунду | 37.8 | 53.7 |
| 1% минимальное количество кадров в секунду | 37.8 | 50.3 |
Данный метод сглаживания действительно увеличивает производительность не в ущерб качеству.
Сравнительные результаты в 4К разрешении (профиль максимум, ТАА):
| RTX выкл. | RTX средн. | RTX высок. | |
| Среднее количество кадров в секунду | 63.3 | 59.7 | 58.9 |
| Минимальное количество кадров в секунду | 46.1 | 41.3 | 37.8 |
| 1% минимальное количество кадров в секунду | 53.6 | 49.4 | 49.2 |
Добавление правильных теней при установке среднего и высокого качества настроек графики почти не ухудшает производительность новой видеокарты Nvidia.
Что нас ждет – провал или восхождение на Олимп? В Nvidia знают ответ на вопрос и предлагают свой, альтернативный путь развития 3D. «Стагнации бой» – так должен звучать новый лозунг компании.
Но посмотрим, на какие жертвы пришлось пойти. Глупое наращивание ядер CUDA невозможно в рамках ограниченного энергопотребления видеокарт (мы же не хотим вернуться в прошлое с 500-ваттными монстрами), а текущий техпроцесс и нерадостные новости о стоимости его смены на более тонкий заставляют производителя делать расчет на будущее (как внедрять инновации и в какую сторону развиваться).
К тому же сама технология трассировки лучей давно обкатана в кино и научных расчетах, а значит, данное направление не станет чем-то неизведанным как безгранные просторы космоса. И единственный путь – риск и движение в этом направлении.
Не будем забывать и о сложившейся на рынке 3D графики ситуации: фактически у Nvidia есть запас времени, пока конкурент отстает на несколько лет, и это стало еще одним фактором, минимализирующим риски неправильного выбора. Стоит ли овчинка выделки? При почти двукратном росте стоимости топовой модели найти обоснование сложно, пока пользователь воочию не убедится в разумности такой траты.
Искусственный интеллект, трассировка лучей, что дальше? Много это или мало для принятия решения? Помнится, VR тоже дал надежду на новый тип развлечения, но для геймеров он стал слишком узконаправленным и дорогим вложением. С другой стороны, странное развитие DX (будто у API нет программы развития и улучшения, все происходит в рваном режиме), которым управляет не MS, а другие люди, вселяет еще одну надежду на то, что RTX появится в нем не как compute ответвление, а полноценный апгрейд. Впрочем, мы за любое развитие индустрии, лишь бы не платить за него $999-1199.
Выражаем благодарность за помощь в подготовке материала: