NVIDIA устанавливает новый стандарт для высокопроизводительных вычислений с выходом Tesla GPU на базе архитектуры Kepler

15 мая 2012 года NVIDIA представила новое семейство графических процессоров Tesla на базе революционной вычислительной архитектуры NVIDIA Kepler, которая упрощает и делает более доступными GPU-ускоряемые вычисления для широкого спектра высокопроизводительных (HPC) научных и технических приложений.

Новые GPU NVIDIA Tesla K10 и K20 – это вычислительные ускорители, созданные для решения самых сложных в мире HPC задач. Архитектура Kepler создана специально для высокой производительности и рекордно низкого энергопотребления, она втрое более экономична, чем предшественница NVIDIA Fermi, создавшая новый стандарт для параллельных вычислений два года назад.

“Fermi – это был важный шаг в вычислениях, - отмечает Билл Дэлли (Bill Dally), главный научный сотрудник и старший вице-президент по исследованиям в NVIDIA. – Эта архитектура дала начало GPU-ускоряемым вычислениям в области высокопроизводительных вычислений и привлекла внимание сотен тысяч разработчиков к платформе для вычислений на GPU. Kepler также обеспечит широкое применение GPU в технических вычислениях благодаря простоте их использования, широкой сфере применения и экономичности”.

GPU Tesla K10 и K20 были представлены на конференции по GPU-технологиям (GTC) в серии анонсов от NVIDIA, доступ к которым можно найти в онлайн пресс-центре GTC.

NVIDIA разработала набор инновационных архитектурных технологий, которые делают графические процессоры Kepler суперпроизводительными и экономичными, а также незаменимыми для широкого круга разработчиков и применений. Основные инновации:

  • SMX потоковый мультипроцессор – Будучи основным строительным материалом каждого GPU, SMX потоковый мультипроцессор был создан с нуля для высокой производительности и экономичности. Он обеспечивает производительность на Ватт до 3 раз выше по сравнению с потоковым мультипроцессором Fermi, который позволяет создать суперкомпьютер производительностью в один петафлопс всего на 10 серверных стойках. Экономичность SMX была достигнута за счет вчетверо большего числа ядер CUDA при сокращении частоты каждого ядра, отключения питания частей GPU, находящихся в простое, и увеличения площади GPU, предназначенной для ядер для параллельных расчетов вместо управляющей логики.
  • Динамический параллелизм – Эта функция позволяет потокам GPU динамически генерировать новые потоки, чтобы динамически адаптироваться к данным. Новая технология существенно упрощает параллельное программирование за счет применения GPU-ускорения к широкому спектру распространенных алгоритмов, таких как адаптивное уточнение сеток, быстрые мультипольные и мультисеточные методы.
  • Hyper-Q – Эта функция позволяет нескольким ядрам CPU одновременно использовать ядра CUDA на одном GPU Kepler. Нагрузка на GPU значительно вырастает, уменьшается простой CPU и улучшается программируемость. Hyper-Q – это идеальное решение для кластерных задач, использующих MPI.

“Мы преследовали три цели при создании Kepler: производительность, экономичность и доступность, - отмечает Джона Албен (Jonah Alben), старший вице-президент по проектированию GPU и главный архитектор Kepler в NVIDIA. - Это важная веха в истории вычислений на GPU, которая должна породить новую волну достижений в вычислительных исследованиях”.

GPU NVIDIA Tesla K10 и K20
GPU NVIDIA Tesla K10 обеспечивает самую высокую пропускную способность для приложений обработки сигналов, изображений и сейсмических данных. Ускоритель Tesla K10 оптимизирован для нефтегазовой и оборонной промышленности благодаря двум процессорам GK104 Kepler на плате, которые обеспечивают суммарную производительность в 4.58 терафлопс в операциях одинарной точности с плавающей точкой и полосу памяти в 320 ГБ/с.

GPU NVIDIA Tesla K20 – это новый флагман семейства Tesla, созданный для самых ресурсоемких вычислительных задач. Ожидается, что Tesla K20 станет самым производительным и экономичным в мире графическим процессором. Его поставки начнутся в четвертом квартале 2012 года.

Tesla K20 основан на GPU GK110 Kepler. Он обеспечивает производительность в операциях с двойной точностью втрое выше, чем продукты Tesla на базе архитектуры Fermi, и поддерживает Hyper-Q и динамический параллелизм. GPU GK110 будет установлен в новый суперкомпьютер Titan Национальной Лаборатории Окриджа в штате Теннесси и в систему Blue Waters в Национальном Центре Супервычислительных Приложений при Университете Иллинойса в Урбана-Кампейн.

“За два года после выпуска Fermi гибридные вычисления получили широкую популярность, повышая производительность в ряде критически важных HPC приложений, - отметил Эрл Джозеф (Earl C. Joseph), вице-президент по высокопроизводительным вычислениям в IDC. - Мы ожидаем, что в течение ближайших двух лет GPU будут использоваться еще больше, чтобы повысить производительность во многих других приложениях”.

Предварительный обзор платформы для параллельного программирования CUDA 5

В дополнение к архитектуре Kepler NVIDIA сегодня знакомит с платформой для параллельного программирования CUDA 5. Доступная более чем 20000 участникам программы NVIDIA GPU Computing Registered Developer, платформа позволит разработчикам исследовать возможности новых GPU Kepler, включая динамический параллелизм.

Планируется, что модель параллельного программирования CUDA 5 появится на рынке в третьем квартале 2012 года. Разработчики могут получить доступ к предварительному релизу, зарегистрировавшись в программе GPU Computing Registered Developer на сайте CUDA.

Telegram-канал @overclockers_news - это удобный способ следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал
рейтинг: 3.7 из 5
голосов: 6

Возможно вас заинтересует

Сейчас обсуждают