Озвучены некоторые характеристики GK110

Редакция

Новости Hardware 16 мая 2012, 06:57 Алексей Сычёв

Увы, продукт пока не поможет убивать время за компьютерными играми.

Хотя на момент появления первых публикаций о Tesla K10 подробного описания характеристик этого продукта не существовало, мы смогли определить, что этот ускоритель вычислений несёт на борту два графических процессора GK104 и 2 х 4 Гб памяти типа GDDR5. Каждый процессор имеет по 1536 ядер CUDA и 256-битную шину памяти с пропускной способностью 320 Гбайт/с. Пиковая производительность в операциях с плавающей запятой одинарной точности – 4.58 терафлопс, двойной точности – 0.19 терафлопс (по 95 гигафлопс на процессор).

Гораздо интереснее было бы изучить подробные характеристики Tesla K20 – ускорителя вычислений, который основан на новом процессоре GK110, содержащем 7,1 млрд. транзисторов. Напомним, что у GK104 этот показатель равен 3,54 млрд. транзисторов. К сожалению, Tesla K20 выйдет только в четвёртом квартале этого года, и об игровых продуктах на базе GK110 компания пока ничего не сообщает. Судя по заявленным характеристикам, процессор в большей степени ориентирован на рынок вычислений.

В частности, уровень быстродействия в операциях с плавающей запятой двойной точности будет в три раза выше (более гигафлопса), чем у решений поколения Fermi (Tesla M2090), но только в пересчёте на один ватт потребляемой энергии. Как поясняет NVIDIA, эффективность потокового мультипроцессора SMX была повышена относительно Fermi за счёт вчетверо большего числа ядер CUDA при сокращении частоты каждого ядра, отключения питания частей GPU, находящихся в простое, и увеличения площади GPU, предназначенной для ядер для параллельных расчётов вместо управляющей логики. Сколько таких мультипроцессоров SMX будет содержать GK110, не уточняется, но предварительный анализ приведённого снимка кристалла позволяет предположить, что их количество достигнет 15 штук. Таким образом, всего GK110 может содержать от 1920 до 2880 ядер CUDA, если на каждый SMX придётся по 128 и 192 ядер, соответственно.

По предварительным данным, GK110 будет иметь 384-разрядную шину памяти, сама NVIDIA эту характеристику не уточняет. Объём памяти может быть равен 6, 12 или 24 Гб. Всё зависит лишь от того, в какую сумму производителю обойдётся нужный объём GDDR5 в четвёртом квартале этого года. В первых суперкомпьютерах на базе Tesla K20 будут применяться решения с 6 Гб памяти.

Плата Tesla K20, которую вы можете лицезреть на фотографии, ориентирована на использование в серверных системах, а потому лишена собственного вентилятора. На "корме" мы видим шести- и восьмиконтактный разъёмы питания. Уровень энергопотребления не должен превышать 300 Вт, хотя он может быть и ниже.

На архитектурном уровне NVIDIA Tesla K20 готов предложить следующие новшества:

SMX потоковый мультипроцессор – Будучи основным строительным материалом каждого GPU, SMX потоковый мультипроцессор был создан с нуля для высокой производительности и экономичности.
Динамический параллелизм – Эта функция позволяет потокам GPU динамически генерировать новые потоки, чтобы динамически адаптироваться к данным. Новая технология существенно упрощает параллельное программирование за счёт применения GPU-ускорения к широкому спектру распространённых алгоритмов, таких как адаптивное уточнение сеток, быстрые мультипольные и мультисеточные методы.
Hyper-Q – Эта функция позволяет нескольким ядрам CPU одновременно использовать ядра CUDA на одном GPU Kepler. Нагрузка на GPU значительно вырастает, уменьшается простой CPU и улучшается программируемость. Hyper-Q – это идеальное решение для кластерных задач, использующих MPI.

Tesla K10 поддерживает только SMX, две остальных функции будут присущи только Tesla K20.

#nvidia #kepler #tesla #gpgpu #gk110 #cuda

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные статьи