История развития интегрированной графики Intel и ATi/AMD (страница 2)
Пятая генерация (Core i)
В очередной раз смена поколений процессоров потребовала изменения названия графической части. С того момента и по сей день все видеорешения Intel несут название HD Graphics. Появилось оно в 2010 году и содержит всего одну базовую модель Ironlake (Clarkdale). Можно сказать, что с этой модели начались качественные изменения в интегрированной графике компании. Все вычисления наконец-то переместились в процессор.
В зависимости от модели частота GPU варьируется от 533 МГц до 900 МГц. Количество исполнительных устройств увеличилось до двенадцати штук. Предусмотрена аппаратная поддержка Shader Model 4.0 и DirectX 10. Пропускная способность памяти составила от 17 Гбайт/с до 21.3 Гбайт/с. Младшие процессоры Celeron G11хх и Pentium G69xx все еще обделены Intel Clear Video и Intel Quick Sync Video. Да и в более дорогих моделях присутствует лишь Intel Clear Video. Перемещение графического ядра в процессор потребовало от Intel радикальных мер.
Судите сами, не очень-то удобно выпускать продукцию с разными размерами кристалла, поэтому все процессоры состоят из идентичной графической части. Под теплораспределительной крышкой спрятано сразу два ядра. На более крупном (45 нм) кристалле разместились интегрированное графическое ядро и контроллер памяти, а на более компактном (32 нм) расположились сами процессорные ядра с кэш-памятью второго уровня.
Очевидно, что минусы компоновки приводят к снижению производительности графического ядра. Шина обмена данных между процессором и видео составляющей сильно сдерживает эффективность. Пока мощность GPU не столь высока, минусы не так очевидны и заметны, но последующая модернизация потребует настоящего объединения и некоторых интересных решений.
реклама
Шестая генерация (Core i)
Вот мы и дошли до более-менее современной истории интегрированной графики Intel.
Sandy Bridge (так называется процессорное ядро) стало первым полностью встроенным решением с графической частью в теле кристалла. Появившись в 2011 году, процессор до сих пор пользуется популярностью у покупателей. Посмотрим, из каких частей он состоит. Сейчас довольно сложно разделить ядро на несколько блоков, поскольку они объединены в одну сложную систему с общей шиной. Шина и является основной ударной силой ЦП. Поток данных и внутреннего кэша равномерно распределяется, загружается и используется как CPU, так и GPU.
Кольцевая шина в SB появилась не впервые. Похожая шина у Intel была внедрена в восьмиядерные серверные Xeon серий Nehalem-EX, откуда она с небольшими изменениями попала в Sandy Bridge. В ней в каждом направлении протянуто четыре шины: запросов, подтверждений, поддержки когерентности и данных шириной 32 байта. Важно, что все операции осуществляются с ECC (коррекцией ошибок).
Нас интересует протокол обмена. Он является переделанной и адаптированной версией шины QPI, или ее аналога HyperTransport у AMD. Пиковая пропускная способность шины четырехъядерного процессора равна 960 Гбит/с, для одно- и двухъядерных моделей соответственно меньше. Но этого вполне достаточно для вычислений, производимых графическим ядром. Узким местом все еще остается шина обмена данными через оперативную память.
Общая площадь четырехъядерного процессора по оценочным подсчетам составляет от 131 мм2 до 216 мм2, а количество транзисторов – от 504 млн (два ядра) до 1160 (четыре ядра). Из них под графический блок выделено от 59-65 млн (HD Graphics /2000) до 114-120 млн (HD Graphics 3000). Оценить соотношение используемой площади вы можете и сами.
Столь разительные отличия зависят от комбинаций числа ядер процессора и типа графического ядра. Всего таких комбинаций три.
- Наибольшая площадь у полноценных ядер с мощной графикой. Sandy Bridge-HE-4, степпинг D2, площадь 216 мм2, 1160 млн транзисторов.
реклама
- Чуть меньше у процессоров с двумя ядрами и мощной графикой. Sandy Bridge-H-2, степпинг J1, площадь 149 мм2, 624 млн транзисторов.
- И самая маленькая площадь у остальных моделей. Sandy Bridge-M-2, степпинг Q0, площадь 131 мм2, 504 млн транзисторов.
В эпоху глобальной экономии средств хороши любые методы. В конце концов, Intel производит, да-да, все еще производит сразу три версии кристаллов Sandy Bridge.
Пора подробнее рассмотреть графическую часть. Она состоит из двух физических моделей и трех названий. HD Graphics и HD Graphics 2000 – это разные названия одного видеоядра. Оба содержат по шесть исполнительных устройств (EU), совместимы с Shader Model 4.1 и DirectX 10.1. HD Graphics получил частоты 650-1100 МГц, а HD Graphics 2000 – 650-1250 МГц. С частотами всегда можно поиграться, поскольку Intel не блокирует выбор частоты в отличие от множителя процессора. Но чего никогда не получить на HD Graphics, так это поддержки Intel Clear Video и Intel Quick Sync Video. Обе технологии доступны только для процессоров с HD Graphics 2000.
Самая мощная версия наделена двенадцатью исполнительными устройствами, частотами 850–1350 МГц и пропускной способностью памяти в 21.3 Гбайт/с. В остальном – никаких отличий.
И только предпоследнее поколение IGP Intel обзавелось адекватно работающими драйверами, которые корректно функционируют с большим списком игр и программ. Благодаря этому с HD Graphics /2000/3000 уже можно смотреть в сторону игровых приложений.
Седьмая генерация (Core i)
В 2012 году согласно расписанию Intel (Tick-Tock) пользователи получили последние версии, как процессора, так и интегрированной графики, но так ли велики отличия?
Для начала я расскажу об очередной экономической модели бизнеса Intel. Большой ассортимент ЦП потребовал различных комбинаций вычислительных и графических ядер. И сейчас на фабриках выпускается четыре модели.
- Наибольшая площадь у полноценных ядер с мощной графикой. Ivy Bridge-HE-4, степпинг E1, площадь 160 мм2, 1400 млн транзисторов.
- Чуть меньше у процессоров с четырьмя ядрами и базовой графикой. Ivy Bridge-HM-4, степпинг N0, площадь 133 мм2, количество транзисторов неизвестно.
- Еще меньше у CPU с двумя ядрами и мощной графикой. Ivy Bridge-H-2, степпинг L1, площадь 118 мм2, неизвестное количество транзисторов.
- И наименьшая модель с двумя ядрами и базовой графикой. Ivy Bridge-M-2, степпинг P0, площадь 94 мм2, количество транзисторов неизвестно.
реклама
Очевидно, что у Ivy Bridge-HE-4 есть много общего с Ivy Bridge-H-2. Последний является усеченной версией первого решения (без двух процессорных ядер). По аналогии можно сравнить Ivy Bridge-HM-4 с Ivy Bridge-M-2. Я не готов утверждать, но скорее всего в природе существует две физические модели, а младшие получаются путем отбраковки старших версий.
Несмотря на отсутствие подробного описания графической части, изменения в ней произошли глобальные. Во-первых, нашлась поддержка DirectX 11. Во-вторых, драйвера получили нормальную совместимость с играми. В-третьих, увеличилось количество исполнительных устройств в старшей версии IGP. В-четвертых, была сильно модернизирована графическая часть процессора. На последнем остановимся подробнее.
Directx 11 подразумевает активное использование тесселяции и ряда других возможностей API, из-за чего даже самое маленькое видеоядро Ivy Bridge, состоящее из шести исполнительных устройств, выросло по сравнению с шестеркой исполнительных устройств Sandy Bridge. В функциональных блоках появилась часть, работающая с тесселяцией (Domain shader, tessellator и Hull shader) и полностью исчез блок Pixel Shader c Rasterizer. Переработан Geometry shader. У Half Slice (аналог SMX NVIDIA или SIMD Core у AMD) появился доступ к кэшу третьего уровня (у Sandy Bridge данная функция вообще не заявлена). Глобальный модуль распределения заданий обрел пару локальных планировщиков, по одному на один Half Slice. А каждый Half Slice обзавелся персональным Pixel Shader, общим Rasterizer и текстурным L2 кэшем.
Все усовершенствования нацелены на оптимальную загрузку исполнительных устройств в задачах различной сложности. Для тех, кто интересуется схемами, наши коллеги предоставили подробное описание.
IGP Sandy Bridge:
IGP Ivy Bridge:
IGP Haswell:
Боюсь, что в Haswell нас ждет только увеличение исполнительных блоков без качественного скачка. Но если предварительные данные верны, то встроенная графика ускорится как минимум на 50-60%, хватит ли этого, чтобы обогнать результаты основного соперника в виде APU разработки AMD, мы скоро узнаем.
HD Graphics и HD Graphics 2500 содержат по шесть исполнительных устройств (EU), совместимы с Shader Model 5.0 и DirectX 11. HD Graphics получил частоты 650-1050 МГц, а HD Graphics 2500 – 650-1150 МГц. В HD Graphics отключены функции Intel Clear Video и Intel Quick Sync Video. Обе технологии доступны только для HD Graphics 2500/4000. Старшая версия HD 4000 содержит шестнадцать исполнительных устройств (EU) и работает на частоте до 1150 МГц, на этом все отличия от HD 2500 и заканчиваются.
Страницы материала
Лента материалов раздела
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.


Комментарии Правила