Озвучены некоторые характеристики GK110

Хотя на момент появления первых публикаций о Tesla K10 подробного описания характеристик этого продукта не существовало, мы смогли определить, что этот ускоритель вычислений несёт на борту два графических процессора GK104 и 2 х 4 Гб памяти типа GDDR5. Каждый процессор имеет по 1536 ядер CUDA и 256-битную шину памяти с пропускной способностью 320 Гбайт/с. Пиковая производительность в операциях с плавающей запятой одинарной точности – 4.58 терафлопс, двойной точности – 0.19 терафлопс (по 95 гигафлопс на процессор).

реклама

Гораздо интереснее было бы изучить подробные характеристики Tesla K20 – ускорителя вычислений, который основан на новом процессоре GK110, содержащем 7,1 млрд. транзисторов. Напомним, что у GK104 этот показатель равен 3,54 млрд. транзисторов. К сожалению, Tesla K20 выйдет только в четвёртом квартале этого года, и об игровых продуктах на базе GK110 компания пока ничего не сообщает. Судя по заявленным характеристикам, процессор в большей степени ориентирован на рынок вычислений.

реклама

В частности, уровень быстродействия в операциях с плавающей запятой двойной точности будет в три раза выше (более гигафлопса), чем у решений поколения Fermi (Tesla M2090), но только в пересчёте на один ватт потребляемой энергии. Как поясняет NVIDIA, эффективность потокового мультипроцессора SMX была повышена относительно Fermi за счёт вчетверо большего числа ядер CUDA при сокращении частоты каждого ядра, отключения питания частей GPU, находящихся в простое, и увеличения площади GPU, предназначенной для ядер для параллельных расчётов вместо управляющей логики. Сколько таких мультипроцессоров SMX будет содержать GK110, не уточняется, но предварительный анализ приведённого снимка кристалла позволяет предположить, что их количество достигнет 15 штук. Таким образом, всего GK110 может содержать от 1920 до 2880 ядер CUDA, если на каждый SMX придётся по 128 и 192 ядер, соответственно.

По предварительным данным, GK110 будет иметь 384-разрядную шину памяти, сама NVIDIA эту характеристику не уточняет. Объём памяти может быть равен 6, 12 или 24 Гб. Всё зависит лишь от того, в какую сумму производителю обойдётся нужный объём GDDR5 в четвёртом квартале этого года. В первых суперкомпьютерах на базе Tesla K20 будут применяться решения с 6 Гб памяти.

реклама

Плата Tesla K20, которую вы можете лицезреть на фотографии, ориентирована на использование в серверных системах, а потому лишена собственного вентилятора. На "корме" мы видим шести- и восьмиконтактный разъёмы питания. Уровень энергопотребления не должен превышать 300 Вт, хотя он может быть и ниже.

реклама

На архитектурном уровне NVIDIA Tesla K20 готов предложить следующие новшества:

  • SMX потоковый мультипроцессор – Будучи основным строительным материалом каждого GPU, SMX потоковый мультипроцессор был создан с нуля для высокой производительности и экономичности.
  • Динамический параллелизм – Эта функция позволяет потокам GPU динамически генерировать новые потоки, чтобы динамически адаптироваться к данным. Новая технология существенно упрощает параллельное программирование за счёт применения GPU-ускорения к широкому спектру распространённых алгоритмов, таких как адаптивное уточнение сеток, быстрые мультипольные и мультисеточные методы.
  • Hyper-Q – Эта функция позволяет нескольким ядрам CPU одновременно использовать ядра CUDA на одном GPU Kepler. Нагрузка на GPU значительно вырастает, уменьшается простой CPU и улучшается программируемость. Hyper-Q – это идеальное решение для кластерных задач, использующих MPI.

реклама


Tesla K10 поддерживает только SMX, две остальных функции будут присущи только Tesla K20.
Подпишитесь на наш канал в Яндекс.Дзен или telegram-канал @overclockers_news - это удобные способы следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал
рейтинг: 4.0 из 5
голосов: 68

Комментарии Правила

Возможно вас заинтересует

Сейчас обсуждают