Обзор процессоров Cell. Так ли страшен черт?

для раздела Блоги


Наверное, многие из наших читателей слышали о мультиядерности процессоров Cell, их высоких частотах и непревзойденной мощи в вычислениях с плавающей точкой. Благо, эти процессоры уже встречаются в игровых консолях семейства Sony PlayStation 3, появившихся в Соединенных Штатах в середине этого года. Пришло время раскрыть их секрет. В чем же сила этих процессоров и где их "Ахиллесова пята"?

Введение в историю.


Второго апреля 2002 г. на сайте японской корпорации Toshiba появился пресс-релиз, оставшийся, по большому счету, незамеченным. А между тем его содержание более чем забавно: согласно ему, четыре гиганта разных индустрий объединяли усилия в достижении сразу нескольких стратегических целей. Корпорации Toshiba, Sony и IBM, а также компания Sony Computer Entertainment почти три года назад заключили долговременное соглашение о проведении совместных работ по совершенствованию полупроводниковой технологии "кремний на изоляторе" (SOI, Silicon On Insulator) в целях создания новых высокоинтегрированных микросхем класса "система на чипе" (SOC, System On a Chip). Также на основании отдельного соглашения (упомянутого в пресс-релизе) IBM передавала все последние достижения в области SOI своим партнерам. Вот, собственно, и все, что можно почерпнуть из краткого, написанного эзоповым языком пресс-релизов, документа. Ни упоминаний о том, какими именно будут "системы на чипе", разработанные альянсом, ни одного конкретного слова об области применения, для которой они будут предназначены. И все-таки, и все-таки... когда четыре гигантские корпорации (каждая с годовым объемом продаж, превышающим бюджет среднего государства) образуют некий альянс - то это неспроста.

В конце марта 2001 года в один и тот же день (точнее 22 марта) патентное ведомство США зарегистрировало два документа - # 6809734 и # 20020138637. Первый номер (7 цифр) - это собственно патент. Второй (из 11 цифр) принадлежит заявке на патент (US Patent Application). Одновременная подача этих двух документов - один из способов защитить свои права на интеллектуальную собственность (IP, Intellectual Property). К такому приему прибегают даже, несмотря на то, что "США - единственная страна в мире, делающая различие между законным изобретателем как тем, кто собственно изобрел что-то, и изобретателем - первым подателем заявки на патент, что означает, что только истинному изобретателю предоставляется право на владение патентом" (Essentials of patents. Andy Gibbs, Bob DeMatteis, John Wiley & Sons, Inc., 2003).

Заявка на патент # 20020138637 позволяет установить авторство. В графе "изобретатели" этого документа значатся два человека - Сузуоки Масаказу (Suzuoki Masakazu) и Ямазаки Такеши (Yamazaki Takeshi). И это более чем информативно - Сузуоки Масаказу является директором Sony Computer Entertainment, автором нескольких патентов, одним из разработчиков и архитекторов системы на чипе, на которой основана сегодняшняя PlayStation (второй модели). А вот собственно патент # 6809734 сведения об изобретателях дополняет исключительно важной информацией, в первую очередь о цессионариях (раз темы патентного права и борьбы с ним становятся такими модными, то, наверное, знакомство с некоторыми деталями и терминами не будет лишним). Таким умным словом принято называть правопреемников, которым передается право на операции с собственностью, в том числе с интеллектуальной. В цессионариях патента # 6809734 значатся представители трех крупных компаний. Пресс-релиз Toshiba, подтверждающий создание технологического альянса и передачу ему IBM разработок в области технологии SOI, появился в апреле 2002 г. Патент # 6809734 и соответствующая заявка на патент - на год раньше, в марте 2001 г. И согласно патенту, цессионариями изобретения, сделанного специалистами Sony Computer Entertainment, стали представители Toshiba и IBM. Взаимосвязаны ли эти два события и что происходило в разделяющий их год, мы можем только догадываться (если речь идет о взаимосвязи) и гадать (если речь идет о событиях). Догадаться благо нетрудно - и благодаря стабильности списка участников альянса, и немногочисленным последующим за его образованием публикациям. Ну а гадать проще простого - скорее всего, год ушел на бизнес-проверку перспективности запатентованной технологии ("money talk...", причем неспешно). И, наверное, проверка дала обнадеживающие результаты, свидетельством чему является пресс-релиз.

Итак, через три года - 29 августа 2005, компании IBM, Sony, Sony Computer Entertainment и Toshiba объявили о выпуске основных документов, в которых описаны технические детали новых процессоров Cell.

Общие технические характеристики.



Выделим основные особенности рассматриваемого процессора:


  1. Площадь кристалла, на котором создано такое технологическое чудо, трудно назвать маленькой - 221 мм2 при 90 нанометровом технологическом процессе "кремний на изоляторе" (SOI). Для сравнения: один из наиболее мощных массовых микропроцессоров на сегодняшний день, IBM G5, выполненный по той же технологии, размещается на почти втрое меньшем кристалле. Колоссальная сложность и большая площадь кристалла привели к тому, что специалисты оценивают первые образцы Cell как уникальную разработку - не в расхожем смысле "уникальности", а как создаваемую не на основе готовых "полуфабрикатных" компонентов (современные технические нормативы определяют максимальные временные задержки в одном каскаде цифровой обработки на уровне двадцати тактов, но в Cell это значение сокращено до одиннадцати тактов).

  2. Производительность, которая для сегодняшних прототипов лучше всего демонстрируется пиковым быстродействием выполнения вычислительных операций с плавающей точкой, достигает 256 GFLOPS (миллиардов операций в секунду). Много это или мало для однокристального вычислителя? Чтобы "ощутить" эту цифру, воспользуемся не очень честным, но наглядным сравнением. Так, например, вычислительный кластер Университета Цюриха, построенный из 522 узлов (фактически ПК), основанных на процессорах AMD Opteron с тактовой частотой 1,8 ГГц, показывает пиковую производительность 1880 GFlops. То есть 522 весьма "неслабых" классических процессора всего в 7,3 раза "мощнее" одного кристалла Cell. Все это означает, что Cell позволит добиться вычислительной мощности, ранее невозможной для массовых компьютеров. А это, в свою очередь, послужит основой для создания совершенно нового уровня реалистичности в компьютерных играх и каких-то больших неожиданностей в области мультимедиа (не будем забывать, что в списке участников проекта Cell значится Sony).

  3. Существующие образцы Cell-системы, выполнены в BGA-корпусе (Ball Grid Array) размером 4,25x4,25 см с 1236 контактами. По слухам, при тактовой частоте порядка 5,6 ГГц и напряжении питания 1,4 В такому Cell-прототипу достаточно около 180 Вт (по другим данным - 70 Вт), что позволяет прогнозировать снижение потребляемой мощности до 80 Вт (30 Вт) при более подходящих для массовых Cell-процессоров тактовой частоте около 4 ГГц и напряжении питания 1,1 В.

  4. Конечно, насчет разгона ничего констатировать нельзя. Но, учитывая, что инженерный образец работает на частоте 5,6 ГГц при напряжении питания 1,4 В с тепловыделением 180 Вт, то можно предположить, что серийный образец возможно разогнать до 5 ГГц при напряжении 1,25 В и TDP 140 Вт, при использовании специализированного кулера, соответствующего суперкулерам для платформы PC.


Таким образом, у рассматриваемого нами процессора только один минус - огромные размеры, вследствие использования 90 нанометрового технологического процесса. Что, конечно же, несоизмеримо с его плюсами: достаточно низким тепловыделением и колоссальной производительностью.

Архитектура процессоров Cell.




Если попытаться одним словом охарактеризовать способ достижения столь высокой производительности, придется сказать это самое нелюбимое инженерами слово - сложность. Каждый представитель будущего семейства процессоров, объединенных общим наименованием Cell, включает в себя следующий перечень архитектурных элементов:

  • элемент обработки на основе микропроцессора семейства PowerPC (принятая в терминах проекта аббревиатура - PPE, PowerPC Processing Element);
  • синергический элемент обработки (SPE, Synergistic Processing Element);
  • контроллер разделяемой памяти (MIC, Memory Interface Controller);
  • внутриэлементная шина (IEIB, Internal Element Interconnect Bus);
  • контроллер и интерфейс подсистемы ввода/вывода FlexIO.




Наиболее интересный узел Cell - естественно, синергический элемент обработки. По сути, SPE является однокристальной реализацией специализированного микропроцессора, выполняющего систему команд - подмножество хорошо известных под названием AltiVec (и менее известных как VMX) "мультимедийных" операций процессоров семейства PowerPC. SPE - канонический векторный процессор с длиной команды 32 бита и размером вектора четыре 32 битных слова. За обработку отдельных слов вектора отвечают четыре независимых 32 битных FPU и четыре независимых целочисленных вычислителя INT. Но, в отличие от давно известных векторных сопроцессоров (которые использовались в незапамятные времена в компьютерах VAX, да и сегодня незримо присутствуют в распространенных микропроцессорах), SPE - совершенно независимый, самостоятельный вычислитель, что подчеркивается неофициальным его названием - APU (присоединенный процессорный элемент, Attached Processor Unit) - и специально придуманным именем для выполняемых им программ - апулеты (APUlets). SPE содержит внушительное число 128 битных регистров и локальную память достаточного для выполнения вполне функциональной программы-апулета объема - 256 Kб. Векторный характер SPE подчеркивается и организацией этой локальной памяти в четыре раздельных адресных пространства по 64 Kб каждое. Ввиду сверхвысокого быстродействия локальной памяти проблема "выравнивания скоростей" процессора и памяти, решаемая обычно с помощью кэша, в данном случае вообще не возникает и, соответственно, в решении не нуждается. C "внешним миром" SPE общается посредством механизма прямого доступа к памяти и, по сути, с точки зрения управляющего процессора Cell-архитектуры является примитивом, загружающим и исполняющим апулеты. Понятие последних с приемлемой степенью детализации для обзорной статьи можно уточнить разве что путем на удивление удачной аналогии с... объектами в объектно-ориентированном программировании: как и объект, апулет инкапсулирует код векторной программы и обрабатываемые ею данные и загружается (выгружается) в обрабатывающий процессор (APU или SPE) как единое целое.



Архитектура Cell, в которой присутствует управляющий (ведущий) универсальный процессор серии PowerPC G5, с 32 Кб кэша L1 и 512 Кб кэша L2, и ряд соединенных с ним SPE, способных исполнять апулеты, по сути является весьма точным аналогом распределенных вычислителей. Управляющий процессор Cell-элемента хоть и принадлежит к семейству PowerPC, но разве что на основе совпадения системы команд. По сути, ведущий процессор - совершенно новая разработка IBM, 64 битный чип с аналогичными современным процессорам Intel и AMD архитектурными решениями, поддерживающими исполнение многопоточных программ.



В своем роде уникальны и некоторые технологические детали Cell, например шина, обеспечивающая соединение всех вычислителей на кристалле в одно целое. Названная ранее "внутриэлементной", эта 128 битная параллельная шина четырьмя кольцами обегает все архитектурные узлы одного Cell-элемента. Естественно, если вспомнить аналогию с кластерным вычислителем, пропускная способность такой шины, позволяющей одновременно передавать четыре 128 битных слова, совершенно недостижима в "макрокластерах" как массовых продуктах. Из деталей весьма интересен выбор подсистемы управления внешней памятью Cell-процессора. Очевидно, что исключительно высокие показатели производительности этого вычислителя требуют памяти со сверхвысокой пропускной способностью. Разработчики альянса остановили свой выбор на двухканальной подсистеме памяти Rambus XDR, обеспечивающей пропускную способность порядка 25 Гб/с. Пока неизвестна в деталях организация одной из важнейших подсистем, отвечающих за "макроинтеграцию" Cell-вычислителей в единые кластеры - FlexIO. Однако заявленные ее технические характеристики назвать скромными трудно: суммарная пропускная способность реконфигурируемой, состоящей из 96 однобитных последовательных каналов, системы ввода/вывода составляет ни много, ни мало - почти 77 Гб/с.

Заключение.




Хотя Cell-процессоры сейчас представлены только в платформах Sony PlayStation 3 (которые должны появиться в Европе весной следующего года), нельзя полагать, что их применение на этом ограничится. Учитывая, что разработчиками Cell являются одни из ведущих производителей мультимедийной продукции, можно предположить очень широкое их применение в разнообразной аудио и видео технике, новейших игровых консолях, смартфонах, кпк и прочем мобильном оборудовании. Также, вероятно применение рассмотренных нами процессоров в проектах распределенных вычислений (Folding@Home, Rosetta@Home), в связи с огромной производительностью в вычислениях с плавающей точкой, что немаловажно для данных программ. Остается надеяться, что некоторые функциональные блоки Cell-архитектуры найдут применение в PC, что позволит увеличить производительность наших х86-64 процессоров в несколько раз, при относительно невысокой цене.

Обсудить можно здесь.






Telegram-канал @overclockers_news - это удобный способ следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают