Новости 18 декабря 2004 года
Наши коллеги с сайта x86-secret смогли проникнуть внутрь одной из систем, основанных на процессоре Pentium 4 515 (2.93 ГГц). Они сняли скриншот, который выявил принадлежность конкретного экземпляра к степпингу D0:

Собственно, большой сенсации в этом нет - процессоры Pentium 4 в исполнении LGA 775 начинали свой путь именно со степпинга D0. Лишь с переходом на степпинг E0 они обрели поддержку XD, Thermal Monitor 2 и C1E. Разумеется, что процессоры с 533 МГц шиной на степпинге E0 могут и не поддерживать всех этих технологий. В любом случае, достоверной информацией по этому вопросу мы не располагаем.
Что ж, степпинг D0 - это тоже неплохо. Если учесть, что процессор Pentium 4 515 имеет достаточно высокий множитель 22х, то разгон до 4.0 ГГц потребует увеличения частоты системной шины лишь до 180 МГц. Однако, мы еще не изучили особенности разгона процессоров в исполнении LGA 775 с 533 МГц шиной, и здесь могут таиться свои "подводные камни". Нет гарантии, например, что 35% увеличение частоты системной шины при переходе от 133 МГц к 180 МГц не вызовет проблем со стабильностью устройств, подключенных к шине PCI Express.
За последние пару недель мы могли убедиться, что поддержка SLI вообще не задается свойствами чипсета, и даже специальных переключателей и мостов на материнской плате может не быть. Доказательством тому являются попытки производителей создать материнские платы на базе nForce 4 Ultra, поддерживающие SLI. Чипсет i915P тоже "научился" поддерживать SLI без специальной адаптации. Одним словом, были бы на плате два слота PCI Express x16, а SLI организовать удастся без проблем...
Наши коллеги с сайта HKE PC погрузились в изучение особенностей работы чипсетов VIA, связанных с поддержкой технологий класса SLI. Итак, эта технология в исполнении nForce 4 SLI подразумевает разделение потока данных на два канала PCI Express x8. В итоге "на выходе" имеем пропускную способность, эквивалентную режиму PCI Express x8:

Nvidia не раз подчеркивала, что пропускная способность интерфейса в режиме SLI не так важна, ведь обмен данными между видеокартами осуществляется по выделенному SLI-мосту.
Как работает связка "PCI Express x16 + PCI Express x4"? В чипсете VIA K8T890 Pro или VIA PT894 Pro при использовании SLI-моста пропускная способность приводится к "наименьшему общему знаменателю", то есть к режиму PCI Express x4:

Хотя современные видеокарты с интерфейсом PCI Express x16 могут сносно работать даже на скорости PCI Express x2, некоторые потери производительности при этом все же имеют место. Например, в чипсете nForce 4 Ultra реализация поддержки SLI через интерфейс PCI Express x4 приводит к снижению производительности на 5-7%.
Какую альтернативу предлагает VIA? В рамках технологии DualGFX Express она обещает использовать "безмостовую" схему Multi-Mode, реализующую обмен данными между видеокартами на уровне драйверов. Утверждается, что при этом "на выходе" можно получить пропускную способность, эквивалентную режиму PCI Express x16:

Более того, чипсеты VIA смогут организовать и поддержку SLI для видеокарт ATI. Во всяком случае, такая возможность не исключается. Напомним, что собственная технология Multi Rendering от ATI появится в чипсетах компании весной этого года. Для нее тоже не будет нужен SLI-мост, а объединять в одной связке можно будет две разных графических карты на видеочипах ATI.
Известия о новом рекорде пришли, как гром среди ясного неба - из сингапурского форума VR-Zone. Известный в узких кругах сын своей отчизны по имени Shamino смастерил систему охлаждения для двух видеокарт GeForce 6800 Ultra и материнской платы Asus A8N-SLI Deluxe. Судя по внушительным температурам на выходе (-52 градуса Цельсия на GPU1, -95 градусов Цельсия на GPU2 и -101 градус на центральном процессоре), использовалась каскадная "фреонка". Надо сказать, что над созданием "трубной обвязки" надлежащей формы пришлось изрядно повозиться:

Процессор Athlon 64 3800+ был разогнан до 3080 МГц (11 х 279 МГц) при напряжении на ядре 1.6 В. Очевидно, что фреон позволит разогнать процессор еще выше, но Athlon 64 3800+ имеет заблокированный на повышение множитель. Кроме того, более объемный кэш второго уровня процессора Athlon 64 FX-55 мог бы существенно улучшить результат по "процессорной части".
Видеокарты удалось разогнать до 600/1300 МГц - прошлые результаты типа 490/1360 МГц это тоже перекрывает. Следует сказать, что относительно эффективно в таких условиях можно разгонять лишь видеочип, поскольку память охлаждать достаточно сложно. Кроме того, для памяти GDDR-3 частота свыше 1300 МГц DDR уже является предельной.
В итоге удалось добиться результата в 12 457 "попугаев" 3DMark05:

Это не предел, с более мощным процессором результат можно улучшить, ведь системы SLI хорошо масштабируются по процессору.

В тесте 3DMark 2003 был достигнут результат 28 003 "попугая". Это почти на 4500 "попугаев" больше, чем в прошлый раз, когда использовалось водяное охлаждение. Похоже, какими бы жирными не были "попугаи" очередного бенчмарка Futuremark, любители экстремального разгона найдут способ набрать кругленький пятизначный счет :).
Чего мы действительно не знали в силу строжайшей секретности, окружающей подготовку этих процессоров к серийному производству, так это подробных технических спецификаций. Со временем они неизбежно попадут к нам в руки, а пока мы попробуем сформировать небольшой прогноз, построенный на вполне открытой информации.
Известно, что источником первых данных о готовящихся к анонсу процессорах становятся обновления BIOS материнских плат. Поскольку и процессоры Prescott 2M (употребляются также имена "Prescott2M" и "Prescott-2M") уже поставляются в виде инженерных образцов, то самые прозорливые производители материнских плат уже начинают готовиться к их выходу.
Здесь следует пояснить, что ближайшими родственниками Prescott 2M в серверном сегменте станут процессоры Xeon DP на 0.09 ядре Irwindale с 800 МГц шиной и 2 Мб кэша второго уровня. Они должны выйти в середине февраля 2005 года, и занять соответствующие ценовые позиции:
- Irwindale 3.6 ГГц -> $851;
- Irwindale 3.4 ГГц -> $690;
- Irwindale 3.2 ГГц -> $455;
- Irwindale 3.0 ГГц -> $316.
Цены на процессоры Xeon DP с 1 Мб кэша на ядре Nocona понизятся на одну ступень. Заметим, что несмотря на выход процессоров Pentium 4 570J (3.8 ГГц) и Pentium 4 3.8F (EM64T), в этом квартале модель Xeon DP 3.8 ГГц вряд ли появится. Тем не менее, некоторые канадские магазины готовы поставить этот неанонсированный процессор. В осенней версии документов для дистрибьюторов Intel предлагала Xeon DP 3.8 ГГц, но в обновлении от четвертого квартала эта модель из списков исчезла. Очевидно, выпуск процессоров Xeon с частотой 3.8 ГГц вообще отменен, либо перенесен на более поздний срок.
Понятно, что процессоры Irwindale будут полными аналогами Prescott 2M, так что о многих характеристиках этих настольных решений мы можем судить именно по Irwindale. Собственно говоря, заняться этим расследованием нас заставило появление в BIOS материнской платы Tyan Thunder i7525 упоминаний о поддержке процессоров Irwindale:

Как видите, материнская плата была "ознакомлена" с микрокодом этих процессоров. Кроме того, мы можем видеть, что процессоры Irwindale основаны на степпинге N0. Если идти по порядку, то предыдущим степпингом можно считать M0, на котором основаны 0.13 мкм процессоры Xeon MP (Gallatin) и Pentium 4 XE. Возможно, такая логика не кажется убедительной, ведь процессоры Nocona не так давно освоили степпинг E0, который принес поддержку IEST, Thermal Monitor 2 и C1E. Кстати, процессоры Xeon DP на степпинге D0 с частотой 3.4 ГГц и выше тоже поддерживают Thermal Monitor 2 и IEST. Скорее всего, на процессорах Prescott степпинга D0 эти технологии тоже присутствуют в зачаточном состоянии, но отключены физически.
Казалось бы, процессорам Xeon DP логичнее было бы перейти на степпинг типа F0, а не N0. Между тем, объемные кэши второго уровня издавна считались отличительной чертой семейства Xeon MP, поэтому Irwindale можно по праву считать потомком Gallatin. Можно с высокой степенью уверенности предположить, что процессоры Pentium 4 6xx тоже будут основаны на степпинге N0. Каким же будет значение CPUID для этого степпинга?
Логичнее всего было бы предположить, что CPUID изменится с 0F25h (степпинг M0) на 0F26h (степпинг N0). Однако, последнее значение уже используется процессорами Xeon MP степпинга C0. Тогда у Irwindale остается еще один путь - от 0F41h (степпинг E0) к 0F43h (степпинг N0). Хотя в буквенных индексах последовательности нет, смена числовых обозначений ("41" на "43") обеспечивает преемственность. В конце концов, степпинг N0 станет лишь эволюционным продолжением степпинга E0, подарившим процессорам Xeon DP еще 1 Мб кэша второго уровня.
В пользу версии о значении CPUID, равном 0F43h, говорят и недавние обновления популярной в Японии диагностическо-информационной утилиты CrystalCPUID. Во-первых, в логе изменений теперь прописана поддержка процессоров Xeon DP на ядре Irwindale и процессоров Xeon MP на ядре Cranford:

Последний представляет собой "облегченную" версию Potomac без кэша третьего уровня. Процессор поддерживает 667 МГц шину и оснащается 1 Мб кэша второго уровня. Полноценные Xeon MP на ядре Potomac будут оснащаться 8 Мб кэша третьего уровня.
Интересно, что последней строчкой в этой части лога идет упоминание о поддержке процессоров Intel нового поколения, имеющих CPUID вида 0F5xx. Возможно, оно будет принадлежать процессорам Smithfield или одноядерным 0.065 мкм последователям Prescott (CedarMill).
Один из разработчиков утилиты признался, что значение CPUID для процессоров Prescott 2M должно равняться 0F43h. Этой информации не стоит доверять на все 100%, но увязать данное значение CPUID со степпингом N0 мы имеем право.
Долгие поиски иных материнских плат, уже готовых к встрече с Irwindale, натолкнули нас на описание характеристик материнской платы Asus NCCH-DR. В августовской версии инструкции характеристики поддерживаемых процессоров описываются весьма смело:

При этом на официальном сайте максимальная частота поддерживаемых процессоров описывается более скромной цифрой "3.6+ ГГц". Судя по всему, частота 4.4 ГГц была взята из теоретических расчетов по частотному потенциалу 0.09 мкм ядер Intel. На заре освоения этого техпроцесса компания была уверена, что старшие модели Prescott смогут работать на частоте 4.4 ГГц. Подобный оптимизм распространялся и на процессоры Xeon DP на ядре Nocona. В действительности, даже ядро Irwindale вряд ли осилит 4.0 ГГц рубеж, ведь его "будет тянуть вниз" увесистый кэш второго уровня объемом 2 Мб.
Можно предположить, что степпинг N0 в будущем распространится и на часть процессоров Prescott с 1 Мб кэша. Вспомните, ведь степпинг M0 дал жизнь нескольким моделям Northwood, а не только процессорам Pentium 4 XE. Объемный кэш второго уровня занимает на ядре достаточно обширную площадь, и часть кристаллов приходится отбраковывать из-за появления дефектов на этом участке ядра. Отключая дефектные участки кэша на процессорах степпинга N0, можно продавать их под видом Pentium 4 5xx с 1 Мб кэша второго уровня. Частотный потенциал таких процессоров должен быть на уровне аналогов степпинга E0, а вот чудес ждать не стоит.


Сейчас обсуждают