Новости 31 декабря 2003 года

Поскольку Intel так и не находит в себе мужества признать, что в недрах ядра Prescott спрятано грозное оружие под кодовым названием Yamhill, соответствующее архитектуре x86-64 и служащее потенциальным конкурентом AMD64. Слухи о наличии некоторых задатков x86-64 в ядре Prescott поступают из многих источников, и Intel даже не отрицает возможности появления подобных процессоров в 2005-2006 годах, но по поводу Prescott хранит интригующее молчание.

Между тем, наши французские коллеги на сайте x86-secret решили подытожить все существовавшие до этого улики наличия технологий x86-64 в ядре Prescott. Не забывая про подробные иллюстрированные рассуждения на сайте Chip Architect, они решили прибегнуть к простой арифметике.

Идея проста: зная количество транзисторов на процессорном ядре, можно подсчитать "удельный вес" основных блоков процессора без учета кэша второго уровня. Одна ячейка памяти SRAM, из которой формируется кэш второго уровня, состоит из 6 транзисторов. В одном байте содержатся восемь бит, плюс один бит для контроля четности ECC. Таким образом, число транзисторов, занимаемое кэшем объема 512 Кб, может быть рассчитано по такой формуле:

6 * 9 * 512 000 = 27.6 млн. транзисторов

Зная число транзисторов на ядре с учетом кэша второго уровня, мы можем быстро рассчитать "массу нетто ядра":

  • Willamette (256 Кб) -> 42 – 13.8 = 28.2 млн. транзисторов;
  • Northwood (512 Кб) -> 55 – 27.6 = 27.4 млн. транзисторов;
  • Pentium 4 XE (2.5 Мб) -> 169 – 135 = 34 млн. транзисторов;
  • Celeron (128 Кб) -> 36.5 – 7 = 29.5 млн. транзисторов;
  • Prescott (1 Мб) -> 125 – 55 = 70 млн. транзисторов.

Мы видим, что "чистая масса ядра" эволюционирует постепенно, лишь в процессоре Pentium 4 XE чуть выбиваясь на несколько миллионов транзисторов из-за необходимости размещения на ядре блоков согласования с кэшем третьего уровня. Для ядра Prescott эта цифра вообще отличается почти в два раза, при этом Intel официально подтверждает наличие на ядре Prescott площадью 112 кв. мм целых 125 млн. транзисторов. При желании, на нем можно было бы разместить два ядра Northwood и общий кэш объемом 1 Мб!

Попробуем предположить, для чего нужны целых 70 млн. транзисторов ядру Prescott. Известные нововведения заключаются в поддержке инструкций SSE3, увеличенном на 8 Кб размере кэша первого уровня, и потенциально скрытой от чужих глаз поддержке Yamhill – на все 70 миллионов они явно не претендуют. Представители AMD утверждают, что для реализации расширений AMD64 им потребовалось всего 2-3 млн. транзисторов, то есть для Prescott "баланс транзисторов" не сходится.

Не будем забывать, что число контактов процессорного разъема для старших моделей ядра Prescott будет увеличено с 478 до 775, и эти мероприятия также вызваны какой-то необходимостью. Одним словом, поддержка технологий x86-64 действительно может быть заложена в ядре Prescott. Не секрет, что даже технология Hyper-Threading была заложена еще в ядре Willamette, да и некоторые умельцы пытались нас уверить в том, что на процессорах Northwood с 533 МГц шиной ее можно включить.

По этой причине рассматривать предположение о наличии скрытой поддержки Yamhill в существующей версии ядра Prescott мы можем, как нелишенное оснований.

Вчера мы поведали вам о том, как оверклокеры из разных уголков планеты начали изучать перспективы изменения множителя на заблокированных процессорах в исполнении Socket A, произведенных после 39-ой недели 2003 года. Методика преодоления чинимых AMD препятствий была достаточно проста: нужно было переделать настольный процессор в мобильный путем модификации мостиков группы L5. Заметим, что собственно для превращения настольного процессора в мобильный необходимо лишь соединить второй мостик L5 (отмечен синим цветом), последний мостик можно дополнительно соединить (отмечен красным цветом), если планируется использование процессора в роли Athlon MP, то есть в двухпроцессорных конфигурациях.

Обсуждения этой проблемы ведутся на ведущих форумах оверклокерских сайтов, но основным информационным ресурсом, на котором сконцентрирована лаконичная и достоверная информация, остается сайт разработчика утилиты CPU MSR, с легкой руки которого общественность и заинтересовалась возможностью такой трансформации.

Более того, автор внимательно изучил все поступающие сообщения о возможных трудностях при осуществлении модификации, и опубликовал лаконичный, но весьма содержательный FAQ, к которому мы и рекомендуем обращаться всем, кто решился на "хирургическое вмешательство" по изменению множителя.

Мы обозначим только основные опасности и пути их решения, ожидающие первооткрывателей. Во-первых, важно понимать роль мостиков L6 в данном процессе. Они сами по себе не задают текущее значение множителя, то есть их не нужно модифицировать каждый раз для изменения множителя. Они лишь определяют максимальное значение множителя, которое пользователь может выбрать программно при помощи специальных утилит.

Значение множителя "по умолчанию", выбираемое при загрузке, по-прежнему задается мостиками L3. Механизм взаимодействия мостиков L3 и L6 таков...

BIOS на мобильных системах позволяет перейти на максимальный множитель (P-state) сразу после инициализации. В настольных системах модифицированный процессор может вести себя по двум сценариям:

  • В лучшем случае BIOS не делает переход в максимальное состояние P-state, процессор загружается со значением множителя, задаваемом мостиками L3.
  • В худшем случае BIOS делает переход в максимальное состояние P-state, процессор загружается со значением множителя, задаваемом мостиками L6. При этом максимальное значение множителя может быть столь высоким, что система просто зависнет. Если разрезать все мостики L6, то предельным значением множителя станет 24х, поэтому торопиться это делать не стоит – при всех закрытых мостиках L6 значение множителя равно 11х, и это вполне безопасно. Интрига заключается в том, что некоторые "задатки мобильности" могут присутствовать в BIOS наиболее продвинутых материнских плат (типа возможности изменения множителя и напряжения Vcore "на лету"), и модифицировать мостики L6 в этом случае нужно очень осторожно.

Другими словами, при загрузке системы сравниваются значения множителя, задаваемые состоянием мостиков L6 и L3 соответственно. Если все мостики L6 замкнуты, то предельным значением множителя остается 11х (или заданное через мостики L3 значение множителя "по умолчанию" – зависит от того, что больше), если же задаваемое состоянием мостиков L6 значение множителя больше множителя "по мостикам L3", то при загрузке используется оно.

Возьмем для примера заблокированный процессор Thorton, работающий на частоте 1667 МГц (12.5 х 133 МГц). Заданный через мостики L3 множитель равен 12.5х – он "намертво" зафиксирован, и изменить его извне мы не можем. После превращения процессора в "мобильный" путем соединения второго мостика L5 можно задавать предельное значение множителя через мостики L6. Если они все замкнуты, то предельный множитель равен 11х. Это меньше, чем 12.5х, поэтому по умолчанию используется именно множитель 12.5х. Чтобы позволить системе увеличивать множитель, нужно модифицировать мостики L6. Для множителя 13.5х следует размокнуть три нечетных мостика в группе L6 (":C:C:").

Кстати, постоянно пополняемый список поддерживающих такой "фокус" чипсетов находится здесь. По поводу излюбленного оверклокерами чипсета NForce 2 Ultra 400 Мы можем пока сказать, что в некоторых случаях трюк работает, в некоторых нет. Очевидно, от возможностей BIOS конкретной материнской платы тоже многое зависит.

О программных ограничениях тоже стоит сказать пару слов: установлено, что под управлением операционных систем поколения NT (Windows NT, Windows 2000 и Windows XP) программа CPU MSR работает корректно, а вот с Windows 98 не дружит.

Теперь поговорим об изменении напряжений на ядре модифицированного процессора. Поскольку для мобильного варианта номинальное напряжение на ядре задается мостиками L8, многие наши читатели и участники конференции насторожились тем, что при всех закрытых мостиках L8 на трансформированном процессоре выставится напряжение 2.0 В. Разумеется, это могло бы привести к неприятным последствиям.

Тем не менее, автор утилиты утверждает, что мостики групп L8 и L11 взаимодействуют аналогичным образом, что и мостики групп L3 и L6. Нюанс заключается в том, что на настольных материнских платах группа контактов, отвечающая за изменение "мобильного напряжения", не подключается к регулятору напряжений. По этой причине напряжение на ядре не изменяется при переделке процессора в мобильный. Диагностические утилиты при этом могут писать, что напряжение изменилось, но фактически оно останется прежним.

На сегодняшний день это все соображения, которыми практикующие оверклокеры хотели бы поделиться с мировой общественностью. Надеемся, что новые открытия в этой сфере не останутся без нашего внимания, и методика изменения множителей на процессорах с разъемом Socket A будет успешно реанимирована.

Компания Gainward известна своей любовью к оверклокерским видеокартам. Заметим, что рецепт изготовления видеокарты с хорошим разгонным потенциалом стар, как мир: многослойный дизайн платы от старшей версии, быстрая память, специальный BIOS и хорошее охлаждение. Большинство этих ингредиентов в свои продукты Gainward закладывать удается.

Не так давно мы могли убедиться, что даже потенциально убогую GeForce FX 5600 XT компания Gainward смогла превратить в неплохое оверклокерское решение.

Инженеры компании не останавливаются на достигнутом, и планируют в январе поставить на поток производство видеокарты Gainward FX 5700 DT 128 Мб, основанной на чипе GeForce FX 5700. Разумеется, что для сохранения лучших традиций компании эта видеокарта будет основана на дизайне старшей платы класса GeForce FX 5700 Ultra:

На восьмислойную плату будут устанавливаться восемь чипов памяти GDDR-I в упаковке FBGA со временем выборки 2.8 нс. Это уже обеспечивает шансы разогнать память до частот 700-750 МГц DDR при типичных для эталонных вариантов 550 МГц DDR. Собственно говоря, именно потенциал разгона памяти отравляет жизнь владельцам GeForce FX 5700 - разогнать память в исполнении TSOP со временем выборки 3.3-3.6 нс редко удается свыше 600 МГц DDR.

За перспективы разгона чипа можно не беспокоиться - при таком дизайне и эффективном кулере он наверняка разгонится до частот свыше 500 МГц. Другими словами, эта видеокарта вплотную подберется к показателям производительности GeForce FX 5700 Ultra. И дополнительный разъем питания на плате предусмотрен - для обычных вариантов GeForce FX 5700 его наличие необязательно.

Единственная проблема для инженеров компании заключалась в необходимости "подружить" GeForce FX 5700 с памятью типа GDDR-I, ведь эталонные платы класса Ultra работают с памятью GDDR-II, а платы класса GeForce FX 5700 работают с памятью DDR в исполнении TSOP. Собственно, чип NV36 с памятью типа GDDR-I должен работать без затруднений, а вот BIOS пришлось отлаживать целый месяц. Теперь все проблемы позади, и эта видеокарта в скором времени поступит в продажу. Ожидаемая цена 128 Мб версии - примерно $125, что достаточно привлекательно с учетом хорошего разгонного потенциала платы.

Удивительно, но некоторые казусы происходят с завидной периодичностью. Ровно год и одну неделю назад мы не без тени иронии сообщили о том, что китайские разработчики смогли создать процессор оригинальной архитектуры, первый китайский процессор, если так можно выразиться. Смех смехом, но за прошедший год Китай запустил на орбиту пилотируемый космический корабль (не без помощи российской стороны, но все же :)), а уж о темпах роста национальной экономики интересующимся данным вопросом телезрителям наверняка доводилось слышать. Страна растет и развивается, и сферу высоких технологий Китая технический прогресс стороной не обходит.

В двадцатых числах декабря китайской публике был представлен рабочий образец процессора Dragon 2, представляющего собой уже последователя описанного нами процессора Soaring Dragon. Вот так выглядит новинка:

Да-да, очень напоминает процессоры в слотовом исполнении. Собственно говоря, по частотным характеристикам китайский процессор как раз укладывается в период царствования Pentium II - рабочая частота первых инженерных образцов достигает 300 МГц. Тем не менее, это не предел - серийные экземпляры должны достичь частоты 500 МГц. При этом они достаточно уверенно будут соперничать не только с Pentium II, но и будут покушаться на лидерство в соревновании с Pentium III. Вот так видят китайцы средний показатель производительности Dragon 2 в тестах Spec CPU 2000 (отмечен красным цветом):

Dragon 2 на какие-то 25-35% отстает от Athlon XP 1700+ и Pentium 4 1.5 ГГц соответственно. Учтите, что частота китайского процессора при этом почти в три раза ниже, то есть удельная производительность Dragon 2 значительно выше. Здесь бы впору вводить систему рейтинга производительности :).

Как уверяют разработчики, с системой Linux этот процессор очень неплохо уживается, и уверенно обрабатывает графику, звуковые потоки, запускает Mozilla и OpenOffice. К 2005 году китайцы намерены вывести показатели быстродействия этих процессоров на уровень Pentium 4 2.0 ГГц. Остается только пожелать им удачи в реализации своих замыслов, а упорства и трудолюбия в достижении цели им и без того не занимать :). Кто знает, может года через два разработанные в Китае процессоры станут успешно конкурировать с продукцией AMD и Intel? После очевидных успехов этой страны в освоении космоса можно поверить и в такой вариант развития событий :).

До наступления нового 2004 года остаются уже считанные часы, а это значит, что под выражением "в будущем году" мы совсем скоро начнем понимать "в 2005 году". Весь прошедший год мы рассказывали вам о тех ключевых переменах, которые ждут нас в сфере аппаратного обеспечения в 2004 году. При этом перспектива казалась достаточно отдаленной, и вот мы уже на пороге этого насыщенного событиями периода.

Переход на PCI Express, форм-фактор BTX, память DDR-II, новые конструктивные исполнения - это лишь малая часть тех перемен, которые нас ждут в 2004 году. Тем не менее, среди прочих анахронизмов есть еще один, прижившийся в современных персональных компьютерах почти с 1982 года. Речь идет о BIOS или Базовой Системе Ввода-Вывода. Современные BIOS материнских плат стали гораздо более функциональными, но они имеют в своей основе дебютировавшие в 1982 году наработки. Неужели и в двадцать первом веке нам потребуются дискетки с образом BIOS, чтобы обновлять микрокод материнской платы?

Как вы могли понять по содержанию минувшего IDF Fall 2003, ситуация с модернизацией концепции BIOS постепенно сдвигается с мертвой точки. На смену BIOS придет EFI (Extensible Firmware Interface, то есть "расширяемый интерфейс микрокода"), и первые решительные шаги по его продвижению Intel и Microsoft начнут уже в 2004 году.

Точнее говоря, два гиганта намерены учредить в ближайшие три месяца форум разработчиков EFI, куда смогут войти все заинтересованные компании. Результатом работы форума должно стать принятие промышленных стандартов на реализацию EFI, и уже в 2005 году чипсеты Intel начнут переход на поддержку EFI. Это не значит, что совместимость с BIOS будет утрачена, просто некоторые "продвинутые функции" будут недоступны сторонникам "старых методов".

Кстати, первый прототип EFI уже реализован на серийно производимой системе - пионером стала Gateway 610 Media Center Desktop. Непосредственно Microsoft планирует встроить поддержку EFI в операционную систему Windows Longhorn.

Помимо выгод и удобств для пользователя, EFI позволит разработчикам проще программировать функции микрокода устройств и материнской платы. Косвенной причиной стремления крупнейших компаний скорее перейти на EFI является отсутствие достаточного числа квалифицированных программистов, способных работать с ассемблером. Нельзя однозначно сказать, кому EFI больше облегчит жизнь: разработчикам или пользователям :).

Между прочим, не все разработчики стремятся скорее перейти на EFI. Крупнейший разработчик BIOS, компания Phoenix, уже выдвинула собственную инициативу под названием CSS (Core System Software), и не собирается переходить на поддержку EFI прежде, чем та станет промышленным стандартом.

В общих чертах EFI призвана создавать дозагрузочное программное окружение (preboot software framework), своеобразный "каркас". Разработчики смогут "обвешивать" этот каркас программными модулями, аналогичным по своим функциям драйверам устройств в операционной системе. Одна из приоритетных задач EFI - сделать процесс обновления управляющих программных модулей простым, а процесс загрузки операционной системы - более быстрым.

В подобном дозагрузочном программном окружении можно будет запускать антивирусы и диагностические утилиты, облегчающие процесс обслуживания системы. Внедрение EFI должно повысить общий уровень надежности и стабильности системы.

Поддержка со стороны Intel и Microsoft отнюдь не означают, что другие компании и платформы останутся без альтернативы существующей системе BIOS. Форум EFI как раз и будет создан для того, чтобы сделать эти технологии широко доступными. И все же, переход на EFI не произойдет в одночасье - вспомните хотя бы историю с внедрением USB. Прошло уже несколько лет, а старые интерфейсы все еще сосуществуют с перспективным USB. Аналогичным образом произойдет и с EFI, начать этот процесс в масштабах всей индустрии Intel обещает в 2005 году, то есть через год :).

Сейчас обсуждают