GF100 (GT300): официальный анонс и новые подробности

На этой неделе основным источником новостей является графический процессор следующего поколения GF100, известный ранее как GT300. Являясь первым воплощением новой вычислительной архитектуры Fermi, этот чип обещает произвести революцию не только в расчётах общего назначения на GPU, но и в 3D. Впрочем, представители NVIDIA пока воздерживаются от каких-либо комментариев по поводу производительности новинки в 3D.

Но, перейдём к изучению новых подробностей о GF100. Итак, начнём со схематичного изображения:

Как видно, схема подтверждает ранее известную информацию. Напомним, вкратце, основные характеристики GF100. Новая архитектура Fermi, 512 потоковых процессоров (ядер), разбитые на 16 блоков по 32 штуки, 128 блоков выборки текстур (TMU), 48 блоков растровых операций (ROP) и 384-битная шина памяти с поддержкой до 6 Гб видеопамяти GDDR-5. Тактовые частоты новинки, составят, предположительно, 650/1700/4200 МГц для ядра, шейдерного домена и памяти соответственно. А вот как выглядит снимок ядра:

Хорошо заметны 16 однотипных блоков (SM), занимающих две трети ядра. Интерфейсы ввода-вывода расположились, закономерно, по периметру кристалла. А вот так выглядит уже упакованный GF100:

Подобно своим предшественникам – G80 и GT200, кристалл защищён медной пластиной, которая не только защищает кристалл от скола, но и является теплораспределителем. Нанесённая на крышке маркировка позволяет понять, что под ней прячется кристалл первой ревизии (А1), произведённый на 35 неделе этого года, т.е. между 24 и 30 августа. Оборотная сторона чипа интересна числом электрических выводов, которых там около 1900 штук. Это почти на 450 штук больше, чем у G80, что объясняется дополнительными выводами для поддержки GDDR-5, но на 600 штук меньше, чем у GT200, что объясняется наличием 384-битной шины памяти вместо 512-битной.

Рассмотрим упущенные ранее подробности об архитектуре. Во-первых, регистровые файлы потоковых процессоров были удвоены по сравнению с GT200. Это благоприятно скажется на исполнении сложных шейдеров, ну и, разумеется, GPGPU вычислениях. Второй важный момент, это возможность управлять размером кэша L1 и общей памяти в каждом блоке SM. Можно выбирать между двумя значениями – 16 Кб и 48 Кб. Увеличение объёма кэша L1 с 16 Кб до 48 Кб отзовётся симметричным уменьшение общей памяти с 48 Кб до 16 Кб и наоборот. Такая гибкость позволит адаптировать архитектуру к выполнению 3D или GPGPU задач. Последнее, что хочется отметить, это тот факт, что все потоковые процессоры являются FMA устройствами, а не MAD, как раньше. Оба этих блока способны выполнять операцию вида A*B+C, но разница между ними в том, что FMA не округляет результат произведения перед суммированием, что даёт более точный результат, а точность, как известно, никогда не бывает лишней, особенно в научных расчётах. Фактически можно говорить о том, что GPU уже и в этом отношении превзошли CPU, так как современные процессоры не имеют FMA устройства и пока только идёт речь о появлении их в новых поколениях.

Желающие самостоятельно ознакомиться с детальными подробностями о новой архитектуре, могут скачать официальный документ (848 Кб), или же прочитать описывающую этот документ статью. Напоследок приведём диаграмму, показывающую пиковую теоретическую производительность на различных операциях у актуальных графических процессоров и Core i7:

Telegram-канал @overclockers_news - это удобный способ следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал
рейтинг: 4.5 из 5
голосов: 240

Возможно вас заинтересует

Сейчас обсуждают