Что касается Intel, то эта компания начнет внедрять процессоры с несколькими ядрами в процессоры семейства Itanium. Первым таким CPU станет процессор с кодовым именем Montecito, который появится, ориентировочно, в 2005 году. Этот процессор будет иметь два IA64 ядра. В 2006 году появится следующий процессор в этом семействе, Tanglewood. Tanglewood будет замечателен тем, что в нем будет использоваться от четырех до шестнадцати процессорных ядер. Первые Tanglewood, которые будут выпускаться по 90-нанометровой технологии, не смогут нести в себе более четырех ядер, однако перевод технологии производства Tanglewood на 65-нанометровый техпроцесс позволит увеличить число ядер в этом процессоре еще в четыре раза.
Intel является не единственной компанией, которая собирается активно продвигать идею использования в процессорах нескольких ядер. Подобные планы вынашивает и IBM, которая предполагает выпустить Power 5 с двумя ядрами в следующем году.
Кстати, Intel постепенно начинает удешевлять Itanium-системы, постепенно приближая их к обычным пользователям. Например, IA64 процессоры Deerfield, которые Intel намеревается представить 8 сентября, будут стоить всего лишь $744, в то время как другие чипы семейства Itanium 2, продаются в настоящее время по ценам от $1,338 до $4,226.
Напомню, IA64 – совершенно автономная архитектура, не имеющая совместимости с классической и широко распространенной x86. Тем не менее, Intel надеется, что именно процессоры семейств Itanium/Itanium 2 получат широкое распространение в скором будущем в качестве основы для высокопроизводительных серверов и рабочих станций. Архитектура IA64, разработанная Intel в содружестве с HP, предлагает явный параллелизм на уровне команд. Процессоры IA64 способны выполнять до шести команд за такт, причем в отличие от x86 процессоров, это им нередко удается. Для увеличения числа команд, выполняемых за такт, x86 процессоры используют различные аппаратные ухищрения, такие, как внутреннее разбиение CISC-команд на простые RISC, регистровый файл, аппаратный планировщик, неупорядоченное ядро (out-of-order core), предсказание переходов и спекулятивное исполнение, предвыборка данных и т. п. Архитектура же IA64, фактически, выносит всю эту логику за пределы CPU. Все эти задачи решаются компилятором на этапе трансляции программ. В результате, процессорное ядро Itanium/Itanium 2 имеет значительно более простую и эффективную конструкцию. Так, в процессорах IA64 архитектуры содержится рекордное количество функциональных блоков: 6 целочисленных, 3 блока для обработки ветвлений, 2 блока для операций с вещественными числами, один SIMD блок и два устройства для загрузки/выгрузки регистров. Кроме того, Itanium/Itanium2 имеют и неожиданно короткий конвейер: всего лишь 8 стадий. Еще одной особенностью процессоров Itanium/Itanium 2 следует признать их способность в случае ветвления выполнять предварительные вычисления обеих ветвей с отбрасыванием впоследствии той из них, вычисление которой оказалось ненужным.
Говоря о более привычных характеристиках, отметим, что кеши первого и второго уровней процессоров IA64 архитектуры не отличаются большим размером, но зато имеют сравнительно высокую скорость работы (например, латентность кеша второго уровня Itanium 2 в два раза меньше латентности L2 кеша Pentium 4). L1 кеш имеет всего лишь 16-килобайтную область инструкций и 16-килобайтную область данных. Кеш второго уровня имеет объем 256 Кбайт. Однако для компенсации малого размера L1 и L2 в IA64 был введен еще один уровень кеширования, и на L3 кеш Intel не поскупилась: его объем может достигать в старших моделях Itanium2 целых шести мегабайт. Внушает уважение и фронтальная шина, посредством которой этот процессор соединяется с чипсетом: 128-битная с частотой 400 МГц и пропускной способностью в 6.4 Гбайт в секунду. Правда, следует иметь в виду, что в многопроцессорных системах эта шина разделяется между несколькими процессорами.
В качестве набора логики в Itanium-системах применяются как собственные разработки производителей серверов, так и набор логики Intel E8870. Наборы логики под IA64 процессоры имеют шину памяти с пропускной способностью 6.4 Гбайт в секунду, достигаемую путем применения четырех и восьмиканальных контроллеров памяти.
Заметим, что на данный момент, по данным отраслевых аналитиков, более 85% поставляемых в настоящее время серверов построены на основе архитектуры Intel. Однако выход процессоров семейства AMD Opteron вполне может внести определенные коррективы в этот показатель. Похоже, что таким же образом рассуждает и Intel. По крайней мере с выходом Opteron совпало начало продвижения Itanium 2 в качестве широко распространенного продукта, в то время как до недавних пор поставки IA64 процессоров не носили массового характера.
На настоящий момент Intel массово поставляет процессоры Itanium 2, основанные на 0.13-микронном ядре Madison, с тактовыми частотами до 1.5 ГГц и объемом кеш-памяти третьего уровня 3, 4 и 6 Мбайт. Позднее в этом году Intel планирует представить процессор Intel Itanium 2 с пониженным напряжением питания (кодовое название Deerfield), ориентированный на двухпроцессорные системы с низким энергопотреблением. Этот процессор также будет отличаться не столь высокой ценой, как его предшественники, что откроет ему путь и в высокопроизводительные двухпроцессорные рабочие станции. Для улучшения совместимости процессоров IA64 с обычным x86 кодом, который в настоящее время исполняется на Itanium системах в режиме эмуляции и крайне медленно, будет также представлено специальное программное обеспечение, которое позволит повысить производительность 32-разрядных приложений при работе на платформах на базе процессоров семейства Intel Itanium.
В дальнейшем будут выпущены и другие процессоры этого семейства с большей производительностью, кодовые имена которых известны уже сегодня: Madison 9M, Chivano и Montecito. Любопытно, что процессоры Montecito, которые должны будут появиться в 2005 году, будут содержать по два процессорных ядра. В дальнейшем, количество процессорных ядер на кристалле семейства IA64 будет возрастать еще – выходящий в 2006-2007 году потомок Itanium с кодовым именем Tanglewood будет иметь более чем четыре процессорных ядра на кристалле.
Сейчас обсуждают