Обзор видеокарты MSI GTX 480 Lightning (часть 1)

13 декабря 2010, понедельник 16:52

Оглавление

Вступление

Lightning и MSI – практически синонимы для мира компьютерных комплектующих. Едва ли не каждый, кто хоть раз задавался целью найти лучшее среди равнозначных видеокарт, обращал внимание на оригинальные вещи, например, серию карт Lightning. Быть нестандартным, передовым, сгустком современных технологий в одном лице сложно, но возможно. Таковым видели инженеры одно свое творение. Но, как говорится, не быстро и не сразу пришли они к формуле удачи. Путь был однозначно тернист, а поначалу мы увидели первый «блин», и, честно говоря, я бы назвал его «комом».

Прохладной весной 2009 года увидели свет две «Молнии», основанные на ядре nVidia G200-103-B2 (GTX 260). Как полагается, сразу в исполнении 55 нм и с 216 потоковыми процессорами, с более чем полутора гигабайтами памяти и повышенными частотами. В общем, по всем канонам сообщества оверклокеров.

Первая видеокарта с 10-тью фазами для GPU, точками мониторинга основных напряжений и эффективной системой охлаждения. Во втором варианте использовалась внешняя панель, подключаемая к USB.

Она должна была служить гидом для начинающего энтузиаста и хорошим помощником бывалому «профи». Обе поставлялись с революционным программным обеспечением, способным на лету менять частоту, напряжение Vgpu и скорость вращения вентилятора. Все бы хорошо, если бы не последующие мелкие огрехи в глобальной связи между всеми компонентами. Когда «софт» не умеет или не запускается в современной операционной системе. Когда применяемые параметры никоим образом не воздействуют физически, и таких «нехороших» примеров было предостаточно. Верящие в MSI, затаив дыхание, ждали «заплаток», обновлений, исправлений, ведь сами видеокарты были сделаны на высшем уровне, а благодаря своей «начинке» не раз поднимались на призовые места в международных соревнованиях.

Буквально через считанные месяцы в разгар лета MSI выпускает последователя. На этот раз используется GPU G200-105-B2 (GTX 275).

Посчитав ненужной, внешнюю панель убрали. А утешать покупателей была призвана заново разработанная система охлаждения, далее названная TwinFrozr. Дизайн печатной платы обзавелся следующим порядковым номером: V180 ver1.0 -> V180 ver2.1.

Вместо неудобных площадок замера напряжений появились небольшие направляющие, добавили танталовых конденсаторов, но в целом подход оставался на прежнем уровне с присущем ему недостатками.

Чуть позже, осенью MSI делает первые стратегически важные шаги на пути улучшения программной составляющей Lightning’ов - доверяет Алексею Николайчуку, он же Unwinder, разработку универсальной оболочки для всех видеокарт MSI. А в качестве бонуса MSI Afterburner получила поддержку разгона и мониторинга сторонних карт.

Никто и не догадывался, что на протяжении почти полугода в недрах компании готовился R5870 Lightning. Весной 2010 года анонсировали саму видеокарту, а буквально через месяц она появилась в свободной продаже.

Старания MSI сделать что-то стоящее из Cypress не прошли даром. При разработке также были учтены просьбы энтузиастов и проделана работа над ошибками.

С «технической стороны» на видеокарте размещено 6 сдвоенных фаз GPU (6x2) и 3 фазы питания памяти. Применена схема адаптивной подстройки количества используемых фаз, два 8 штырьковых разъема питания, в цепях питания установлены танталовые конденсаторы и полимерные пленочные NEC Proadlizer. Разъемы V-check наконец обзавелись «хвостиками» под щупы мультиметра, но все еще «разбросаны» по печатной плате. В остальном получилась уникальная карта, если бы не врожденная болезнь Radeon’ов «умирать» от статического напряжения, случайно попадавшего на видеовыходы.

Чуть позже вышел самый передовой графический адаптер среди Lightnin’гов – GTX 480.

Речь о нем пойдет в обзоре.

Таблица характеристик и цен

Для визуальной оценки характеристик и расстановки среди конкурентов проще всего взглянуть в таблицу и сравнить видеокарты. Корректировку предлагаю произвести, основываясь на реальных розничных московских ценах. До момента поступления в свободную продажу MSI GTX 480 Lightning судить о перспективности пока что рано. К тому же, учитывая снятие с производства GPU GF100, судьба «Молнии» остается под большим вопросом. Готов предположить, что дизайн PCB спокойно мигрирует для следующей версии под названием MSI GTX 580 Lightning без существенных переделок.

Характеристики HD 5850 HD 5870 HD 5970 HD 6870 GTX 465 GTX 470 GTX 480 GTX 580
Кодовое имя Cypress Pro Cypress XT Hemlock Barts XP GF100 GF100 GF100 GF110
Техпроцесс, нм 40 40 40 40 40 40 40 40
Размер ядра/ядер, мм2 334 334 334 x2 255 ~500 ~500 ~500 ~530
Количество
транзисторов, млн шт.
2154 2154 2154 x2 1800 3200 3200 3200 3300
Частота ядра 2D,
МГц
157 157 157 100 50 / 100 50 / 100 50 / 100 50 / 100
Частота ядра 3D,
МГц
725 850 725 900 607 / 1215 607 / 1215 701 / 1402 772 / 1544
Частота ядра
OC, МГц
1000 1050 950 950 750 / 1500 800 / 1600 800 / 1600 850 / 1700
Напряжение на
ядре 2D, В
0,95 0,95 0,95 0,95 0,9 0,9 0,96 0,95
Напряжение на
ядре 3D, В
1,1 1,15 1,1 1,21 1,05 1,00 1,00 1,00
Число шейдеров,
шт. (PS)
1440 1600 1600 x2 1120 352 448 480 512
Число блоков,
растеризации шт. (ROP)
32 32 32 x2 32 32 40 48 48
Число текстурных
блоков, шт. (TMU)
72 80 80 x2 56 44 56 60 64
Максимальная скорость,
закраски Гпикс/сек
23,2 27,2 46,4 28,8 19,5 24,3 33,6 37,1
Максимальная скорость
выборки текстур,
Гтекс/сек
52,2 68 58 50,4 26,7 32,4 42,1 49,4
Версия
пиксельных/вертексных
шейдеров
5.0 / 5.0 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Эффективная
частота памяти 2D, МГц
1200 1200 1200 300 67 67 67 67
Эффективная
частота памяти 3D, МГц
4000 4800 4000 4200 3206 3360 3700 4008
Эффективная
частота памяти OC, МГц
4800 5200 4400 4800 3500 3600 3900 4100
Напряжение на
памяти 2D, В
1,6 1,6 1,6 1,6 1,57 1,57 1,57 1,57
Напряжение на
памяти 3D, В
1,6 1,6 1,6 1,6 1,6 1,6 1,6 1,58
Объём памяти,
Мбайт
1024 1024 / 2048 1024 х2 1024 1024 1280 1536 1536
Шина памяти,
бит
256 256 256 х2 256 256 320 384 384
Пропускная способность
памяти, Гбайт/сек
128 153,6 128 х2 134,4 102,6 133,9 177,4 192,4
Потребляемая
мощность 2D, Ватт
27 27 42 19 нд нд нд нд
Потребляемая
мощность 3D, Ватт
170 188 294 151 200 215 250 244
Crossfire/Sli да да да да да да да да
Размер карты,
ДхШхВ, мм
244х100х37 282х100х38 340х100х38 248х100х37 270x100x38 270x100x38 270x100x38 270x100x39
Рекомендованная
цена, $
299 399 599 239 279 (229) 349 (259) 499 499

Архитектура GF100/110

Для того чтобы понять, как nVidia смогла разумно распределить и настроить свою основную архитектуру Fermi, нужно всего лишь один раз показать вам это наглядно. Базой для всех GPU послужила собирательная структура слова «Fermi». Основной подход моделирования ядер сильно отличается от «кухни» AMD. Если nVidia «шлифует» и оптимизирует блоки, старается максимально адаптироваться под современные требования, то AMD копирует, клонирует и размножает удачные составляющие. К тому же не грех будет сказать, что существенных улучшений у AMD давно не видно. И сравнивая обоих конкурентов, становится видно, как диаметрально противоположны философии строительства успешного GPU.

Я не брал в расчет графические ядра медленнее GTX 460 (GF104). У AMD рассмотрим всех, кто быстрее Cypress LE, в том числе обе новинки Barts.

Начнем с самой примитивной части графического процессора. В случае AMD это суперскалярный процессор, у nVidia – Cuda Core.

Видеокарта Название GPU Схематичный вид
HD 5870 Cypress
HD 6870 Barts
HD 6970* Cayman*
GTX 460 GF104
GTX 570* GF114*
GTX 480 GF100
GTX 580 GF110

Cypress – 1 SFU, 4 FMAD, в том числе умеющие выполнять операции с двойной точностью.

За один такт может обработать:

  • 4x 32-битных FP MAD,
  • 2x 64-битных FP MUL или ADD,
  • 1x 64-битный FP MAD,
  • 4x 24-битных Int MUL или ADD SFU,
  • 1x 32-битный FP MAD.

Barts – 1 SFU, 4 FMAD, без поддержки двойной точности.

За один такт может обработать:

  • 4x 32-битных FP MAD,
  • 4x 24-битных Int MUL или ADD SFU,
  • 1x 32-битный FP MAD.

GF104 – 1 FMAD, 2 типа CUDA-ядер, с двойной и с одинарной точностью, в соотношении 1 к 2. Блоки SFU вынесены за пределы Cuda-ядра.

За один такт может обработать:

  • 1x 32-битных FP MAD,
  • 1x 64-битных FP MUL или ADD,
  • 1x 64-битный FP MAD,
  • 1x 24-битных Int MUL,
  • 1x 32-битный FP MAD.

GF100 – 1 FMAD, в том числе умеющий выполнять операции с двойной точностью. Блоки SFU вынесены за пределы Cuda-ядра.

За один такт может обработать:

  • 1x 32-битных FP MAD,
  • 1x 64-битных FP MUL или ADD,
  • 1x 64-битный FP MAD,
  • 1x 24-битных Int MUL,
  • 1x 32-битный FP MAD.

GF110 – 1 FMAD, в том числе умеющий выполнять операции с двойной точностью. Блоки SFU вынесены за пределы Cuda ядра.

За один такт может обработать:

  • 1x 32-битных FP MAD,
  • 1x 64-битных FP MUL или ADD,
  • 1x 64-битный FP MAD,
  • 1x 24-битных Int MUL,
  • 1x 32-битный FP MAD.

SM и SIMD блоки:

Видеокарта Название GPU Схематичный вид
HD 5870 Cypress
HD 6870 Barts
GTX 460 GF104
GTX 570* GF114*
GTX 480 GF100
GTX 580 GF110

Сразу видно, что SIMD ядро гораздо проще SM блока. AMD, в первую очередь, берет реванш у соперника за счет количества и простоты, а не качества исполнения. Суммарный объем кэшей и логических буферов у nVidia существенно больше чем у AMD. Предполагаемая схема Cayman’а позволит сократить удельную площадь на 1 суперскалярный юнит. Тип и количество текстурных блоков у SM GF104/114 отличается от таковых в GF100/110. Судя по всему, один SM в GF104/114 занимает большую площадь, чем в GF100/110, и если бы не ограничения в минимальных производственных нормах, мы бы вполне могли увидеть следующее поколение Fermi, основанное на SM от GF104/110.

Следующий шаг - сравнить GPU без вспомогательных модулей, так сказать, чистую математическую мощь.

Видеокарта Название GPU Схематичный вид:
HD 5870 Cypress
HD 6870 Barts
GTX 460 GF104
GTX 570* GF114*
GTX 480 GF100
GTX 580 GF110

Эволюция от Cypress до предполагаемого Cayman’а логична. Огромное число SP юнитов постоянно требует работы, а равномерно и эффективно их «загружать» должен Ultra Threaded Dispatch Processor. Допустим, AMD решила, что в достаточной мере обеспечила беспрерывность вычислений с помощью двух процессоров по очереди, но по моделям тесселяции соперник все еще впереди. И судя по некоторым данным, можно считать, что в будущем Cayman’е поместят целых два блока тесселяции. Впрочем, думаю, что даже такая оптимизация не способна полностью раскрыть потенциал всего GPU.

В nVidia проблему эффективности решают ювелирными модификациями, оснастив каждый SM по блоку тесселяции и геометрии. В итоге чистая производительность выше, чем у AMD, на несколько порядков.

Подход конфигурации контроллеров памяти и ROP практически идентичен у обоих вендоров. Только nVidia в который раз балует нас широкой шиной данных, но относительно низкой частотой. У AMD в этом плане застой, то ли дело в экономической нецелесообразности, то ли в сложности реализации, но прогресс замер на 256 bit. Правда, по эффективному уровню пропускной способности конкуренты находятся на приблизительно одинаковом уровне.

Видеокарта Название GPU Схематичный вид:
HD 5870 Cypress
HD 6870 Barts
HD 6970* Cayman*
GTX 460 GF104
GTX 570 GF114
GTX 480 GF100
GTX 580 GF110

Из приведенных схем напрашиваются несколько выводов:

Для AMD математическая мощность GPU ограничивается искусственными факторами (неспособность блока распределения задач полностью загрузить работой суперскалярные процессоры). Ограниченное пространство GPU не может в себя вписать большее количество блоков тесселяции.

Для nVidia существующая модель архитектуры Fermi уникальна, но ей немного не повезло с размерами. Чтобы уместить все исполнительные элементы, потребовалось слишком большое пространство. А сильное тепловыделение (все CUDA-ядра работают на удвоенной частоте) не позволяет наращивать SM блоки. В итоге потребовалось внедрить дополнительный тип транзисторов на производстве, чтобы удержать тепловой пакет в расчетном значении.

Кстати, впервые промежуточные транзисторы были опробованы в GF104, а уже потом в GF110. Условно-упрощённо, сейчас используется несколько типов: высокой производительности (Hiprf подразделяются еще на 2 вида, высоковольтные и низковольтные), с низкими токами «утечки» (LoLeak подразделяются еще на 2 вида, высоковольтные и низковольтные), транзисторы для цепей ввода/вывода (IO низковольтные), и разработанные специально для решения проблем с Fermi «средневольтные» (MdVlt низковольтные).

Внешний вид

Оригинальный дизайн MSI предполагает незаурядный вид карты. В нотках общей концепции просматривается «предательский» красный цвет, несвойственный видеокартам на основе GPU nVidia.


Печатная плата

Вы боялись размеров GTX 295, HD 5970? Забудьте о них, взгляните на это «чудо»:

Мысленно возникает вопрос, кто за кем прячется. Размеры видеокарты поистине исполинские, как в длину, так и в ширину. До сих пор я поражался масштабам инженерной мысли в создании динозавроподобных видеокарт, но если большинство производителей изготавливало их только для устрашения конкурентов и привлечения взглядов посетителей выставок, то GTX 480 Lightning выпускается серийно!

После снятия системы охлаждения с обеих сторон вырисовываются массивы электронных компонентов, по-семейному сгруппированные на обширном плато под названием PCB:

Как видно по фотографиям, GPU и память занимают небольшую часть доступного места. Их расположение классическое. Чуть больше половины всей PCB отдано на современную схему питания. Начну, пожалуй, с вида спереди:

Три разъема питания, нет, не верю своим глазам. Считаем вслух максимальную нагрузку 30 А + 30 А + 30 А = 90 А. Куда? Зачем? Если абстрагироваться от видеокарты и компьютеров, то представьте, столько же нужно средней иномарке, которая с двигателем внутреннего сгорания и на колесах.

Разъемы для отслеживания трех важных напряжений: Vgpu, Vmem, AUX. Помимо «косичек» MSI решила раз и навсегда избавиться от коротких замыканий и поставила простенькую защиту с предохранителями.

Две микросхемы BIOS’а, обе перезаписываемые. Изначально во втором лежит специальный образ, оптимизированный для сугубо отрицательных температур существования видеокарты.

[+-] Переключатель BIOS’ов отважно поместился в легкодоступной зоне, как для пальцев, так и для азота. Лучше все же его отнести подальше от GPU и подписать оба положения, например, 1-2. А то неровен час, на холодных азотных тестах дешевый «рубильник» вконец замерзнет и развалится или энтузиаст забудет, на какой версии BIOS’а запускать систему.

Гирлянда разноцветных диодов актуальна в канун Нового года, не более того. В открытом стенде так и норовит засветить в глаза. Примечательно, что я ни разу не увидел отображения активности, а через непродолжительное время постоянное сияние стало раздражать. Надо срочно сделать утилиту управления, чтобы выключить такую «забавную» функцию.

Три DIP переключателя задействуют парами аппаратные бонусы. SW2 – повышают напряжение Vgpu (до 1,17 В); Vmem (до 1,65 В). SW4 – Снимает защиту по потребляемому току. Повышение напряжения PLL. SW5 – выбор частоты работы PWM с 266 до 350 МГц.

Подсистема питания карты для GPU

Управление осуществляется ШИМ-контроллером uPI uP6225AM. Задействовано 6 каналов, то есть фактически он управляет только шестью фазами. Естественно, поддерживает протокол I2C, и разнообразные софтвольтмоды ему понятны.

Из шести, с помощью драйверов uP6282AD, фазы размножаются до 12 штук. Это аппаратное решение, и неверно считать фазы только по количеству каналов основного PWM контроллера.

Далее ток протекает через силовые ключи IRF6725 и IRF6723, в относительно новом корпусе DirectFet. Они способны рассеивать значительное количество тепла непосредственно в саму плату и не страдают повышенной хрупкостью, как Volterr’ы.

Питание памяти реализовано за счет трехфазного ШИМ-контроллера uP6207AI. Оба PWM обладают обширным списком современных функций, таких как адаптивная коррекция используемых фаз, компенсация понижения напряжений (Vdrop), плавная регулировка частоты, защиты уровня потребления тока и так далее. В качестве ключей для памяти установили все те же сборки из пары IRF6725 и IRF6723.

Все выходные напряжения фильтруются танталовыми и полимерными (три на питание GPU, один на память) конденсаторами.

Общий вид на систему питания:

Итого: 12 фаз для графического ядра плюс 3 для памяти. Примечательно, что три разъема питания используются раздельно, крайний правый снабжает электричеством только память, остальные два соответственно GPU.

И традиционные снимки на память.

Микросхема упакована под теплораспределяющую крышку на 22 неделе 2010 года. Как и полагается: А3 ревизии, модель GF100-375.

Маркировка памяти - Samsung K4G10325FE HC04, 5 ГГц, 1,5 В.

Система охлаждения

Судя по названию - Twin Frozr, но по внутреннему строению она подверглась сильной модификации со времён выпуска R5870 Lightning и получила индекс III.

На протяжении долгого времени подход конструирования остаётся однотипным. Берём квадратное основание, делаем бороздки под тепловые трубки. По-хорошему запаиваем их. Ещё лучше, если их количество больше, чем у любого конкурента. Используем все доступное пространство под радиатор и наконец устанавливаем пару вентиляторов. Казалось бы, идеальное решение лежит на поверхности, но сразу возникает куча условий, с которыми приходится считаться.

Во-первых, основание обязано быть ровным, с чем у GTX 480 Lightning проблем нет. Качество полировки оценить сложно, поскольку она отсутствует как класс. Вместо полировочной машинки азиатские рабочие применили инструмент под названием фреза. Естественно, я не буду разводить дифирамбы о полезности идеальной полировки. Практическую ценность зеркальная поверхность не несёт, разве что только эстетическую.

Две из пяти трубок в диаметре 8 мм, против 5 мм для остальных. Все наполовину спрятаны в основании. Визуально трудно определить, припаяны ли они. Больше похоже, что использовался какой-то эпоксидоподобный клей.

Сверху на радиаторе расположены два вентилятора размером 92 мм, мощностью в 0.55 А 12 В.

Много больших вентиляторов – это, конечно, хорошо, но мониторинг отслеживает скорость вращения только одного, который расположен над GPU, о чем говорит недостающий кабель в разъёме.

Модули памяти и силовые элементы DC-DC преобразования охлаждаются чёрной алюминиевой пластиной, контактирующей через термопрокладки.

С обратной стороны аналогичная пластина выполняет чисто декоративную роль.

Послушать систему охлаждения:

MSI GTX 480 Lightning [2281 KB]

AMD HD 5970 [2943 KB]

AMD HD 6850 [1707 KB]

AMD HD 6870 [2154 KB]

Продолжение тут.

Выражаем благодарность компании MSI за предоставленную на тестирование видеокарту MSI GTX 480 Lightning.

Дмитрий Владимирович