GeForce GTX Titan X и ускорение вычислений: не всё так безнадёжно

Задолго до официального дебюта GeForce GTX Titan X появилась информация о том, что графический процессор GM200 будет откровенно слаб в расчётах с двойной точностью, а потому ждать появления продуктов семейства Tesla на его основе не имеет большого смысла. Кстати, в существовании Quadro M6000 сомневаться не приходится, и публикация на страницах ресурса ComputerBase является лишним тому доказательством. Представители PNY поведали нашим немецким коллегам, что связывают надежды на обновление ускорителей линейки Tesla только с выходом графического процессора Pascal, который намечен на 2016 год. Об этом решении мы ещё расскажем сегодня в отдельном материале, а пока стоит отметить, что в сегменте Quadro объём памяти в 12 ГБ уже не кажется компании PNY избыточным. Скорее, наоборот, производитель считает, что для профессионального ускорителя графики такого объёма мало.

Тем временем, коллеги с сайта AnandTech обстоятельно разъясняют, как NVIDIA удалось создать достаточно компактный графический процессор GM200 в рамках прежнего 28-нм техпроцесса. Всё дело в том, что отвечающими за вычисления двойной точности функциональными блоками при "растягивании GM204 в полтора раза" решено было пожертвовать, и увеличилось лишь количество отвечающих за ускорение графики и вычислений одинарной точности функциональных блоков. В итоге, "транзисторным бюджетом" удалось распорядиться рационально: производительность в графических приложениях выросла на 50% по сравнению GM204, а площадь ядра увеличилась всего на 9% по сравнению с GK110 (Kepler). В GM200 компании NVIDIA удалось разместить 8 млрд. транзисторов на площади 601 кв.мм. Правда, быстродействием в ускорении вычислений с двойной точностью пришлось пожертвовать, хотя во время трансляции с GTC 2015 глава компании подчеркнул, что в определённых сферах применения GeForce GTX Titan X хорошо проявляет себя при ускорении вычислений. В конце концов, 7 терафлопс при ускорении вычислений с одинарной точностью – это тоже приличный уровень быстродействия.

По словам главы NVIDIA, видеокарты GeForce GTX Titan X можно успешно применять в самообучающихся системах распознавания визуальных образов. Одна из них, AlexNet, при использовании GeForce GTX Titan X достигает заданных показателей за два с небольшим дня, тогда как GeForce GTX Titan на это требуется шесть дней, а центральный процессор Intel Xeon с 16 ядрами выполняет задачу за 43 дня. Более того, объединив в одной системе четыре видеокарты GeForce GTX Titan X, период обучения системы можно сократить до 13 часов.

Готовые компьютеры DIGITS DevBox с четырьмя GeForce GTX Titan X компания будет продавать за $15 000 разработчикам профильных приложений и исследователям. В розничную продажу такие системы не поступят. Тем не менее, их существование доказывает, что NVIDIA не списывает GeForce GTX Titan X со счетов в тех случаях, когда речь идёт об ускорении вычислений. Если же говорить о "чистокровных" ускорителях вычислений, то здесь у NVIDIA имеется GK210, а в следующем году может появиться и 16-нм процессор Pascal с быстрой памятью объёмом до 32 ГБ.

Telegram-канал @overclockers_news - это удобный способ следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал
рейтинг: 4.2 из 5
голосов: 30

Возможно вас заинтересует

Сейчас обсуждают