Ретроклокинг: «Проект36» – мультипроцессорная революция 20 лет назад и сейчас
Оглавление
- Вступление
- Экстерьер и интерьер
- BIOS Setup
- Особенности архитектуры и принципы работы шести CPU
- Разгон шести ядер вместе и по отдельности
- Тестовый стенд
- Результаты тестирования
- Super Pi mod. 1.5XS
- PiFast v.4.1
- wPrime v.1.43
- HWBOT Prime v.0.8.3
- WinRAR x86 v. 5.40
- 7-Zip v.16.04
- AIDA64 5.50.3600
- SiSoftware Sandra 2004 SP2
- Cinebench 2003
- Cinebench R10
- Заключение
- Бонус-раунд при поддержке mentoza
- Super Pi mod. 1.5XS
- PiFast v.4.1
- wPrime v.1.43
- HWBOT Prime v.0.8.3
- WinRAR x86 v. 5.40
- 7-Zip v.16.04
- AIDA64 Cache and Memory Benchmark
- CPU-Z 1.87.0 Benchmark
- Cinebench 2003
- Cinebench R10
- Итоги
Вступление
Лаборатория продолжает цикл статей о ретроклокинге. В прошлый раз мы в общих чертах познакомились с ALR Revolution 6x6 и его последователями, ценниками на подобное «железо», которые были характерны в 1997 году, и провели эксперимент с установкой серверной ОС на ядре Windows XP.
Но на этом история «Проекта36» не закончилась. Как и было обещано, вас ждет рассказ о «хардварной» составляющей шестипроцессорного суперсервера ALR Revolution 6x6 и описание возможностей его прошивки BIOS. Вишенкой на торте станут мультипроцессорные тесты и сравнение производительности с современным HEDT шестиядерником Intel. Не забудем и разгон, куда же без него!
Для разминки взглянем детальнее на ключевые компоненты ALR Revolution 6x6, или в моем случае – версию Unisys (модель Aquanta HS6). Начнем, пожалуй, с экстерьера.
реклама
Экстерьер и интерьер
Размеры корпуса довольно большие для десктопа, но относительно компактные для серверов такого класса. Высота системного блока составляет 68 см, ширина – 32 см, глубина – 58 см. Масса начинается с 52 кг.
У меня есть полный комплект сервера, но не хватает лишь корпуса, поскольку из-за его габаритов пересылка влетела бы в районе $400, если не больше. По этой причине фотографии внешнего вида были взяты из сети Интернет.
Первое, что бросается в глаза – сенсорный(!) LCD дисплей, задачей которого является вывод всей информации о состоянии шести процессоров, оперативной памяти и жестких дисков, а также температур и другой жизненно важной информации. Сегодня подобные экраны уже норма, но 21 год назад я даже и представить не мог, что такое вообще бывает.
реклама
Спереди корпуса доступны два отсека: верхний рассчитан на 5.25" устройства, типа CD-ROM, а нижний открывает доступ к корзине со SCSI накопителями.
Сзади можно видеть 14 слотов расширения, систему охлаждения и корзину с блоками питания.
Для обеспечения работы сервера необходимы два блока питания, которые подключаются к специальной плате в корзине. Третий БП – запасной, на случай выхода одного устройства из строя.
Допускается установка четырех блоков питания с подключением двух пар к двум розеткам электросети для полного дублирования всех обеспечивающих питание сервера функций.
Внутреннее пространство сервера разделено на две секции вдоль всего корпуса. В левой секции находится корзина с блоками питания, размером с небольшой десктопный корпус.
Размеры одной корзины следующие: высота – 39 см, ширина – 15.2 см, глубина – 19 см. Масса корзины с тремя блоками питания составляет чуть более 18 кг. Транспортировать ее посредством USPS из-за океана одно удовольствие.
В противоположной секции размещена гигантская материнская плата, размером с небольшой офисный ПК.
Больше всего интересна система питания материнской платы, которая построена по АТ схеме, это видно по сдвоенному коннектору питания (крайний справа), а также идущим от корзины БП шести толстым черно-красным силовым проводам, подающим напряжение по линии +5 В.
Что-что, а по линии +5 В идет основная нагрузка на всю систему сервера, а в наше время основной потребитель это двенадцативольтная шина.
Если сложить паспортную мощность шести топовых Pentium Pro 200 МГц с 1 Мбайт кэш-памяти второго уровня, то получится 282 Вт. Максимальный запас мощности данного сервера – 700 Вт.
реклама
И поскольку в моем распоряжении есть корзина с тремя блоками питания, рассмотрим один из них более детально.
Блок питания снабжен двумя ручками для удобного извлечения из корзины при горячей замене. Предусмотрен тумблер включения и светодиодный индикатор работы. Для надежной фиксации устройство крепится двумя шурупами к корзине.
Сзади блок питания выглядит следующим образом:
Эти два нестандартных разъема устанавливаются в корзину по типу «папа-мама», готовую приютить четыре таких модели. Изнутри корзина выглядит следующим образом:
Маркировка блока питания говорит о том, что он изготовлен компанией 3Y Power Technology, которая была приобретена в 2006 году известным производителем БП FSP Group. Дата производства – октябрь 1998 г.
Блок питания способен выдавать 40 А по линии +5 В, 7 А по линии 3.3 В и 10 А по линии +12 В. Суммарная мощность составляет 358 Вт.
Чтобы представить и соотнести размер данного блока питания, я его расположил рядом с современным БП мощностью 1000 Вт Zalman ZM1000-EBT. Почувствуйте, что называется, разницу.
А если сопоставить его с моделями БП начала 2000-х, то рядом разместился 650-ваттный Enermax, способный отдать по линии +5 В 46 А. габариты различаются практически в два раза.
Пора перейти к главному элементу – материнской плате. Сказать что она большая, это ничего не сказать, она просто огромная и не хочет помещаться в объектив полностью.
Это самая большая системная плата, которую я когда-либо держал в руках. Ее размеры воодушевляют: ширина – 33 см, длина – 50 см. Сразу бросаются в глаза четыре больших квадратных микросхемы внизу печатной платы – чипсет Intel 450GX. Да, было время, когда слово «чипсет» подразумевало не одну микросхему, как сейчас, а набор.
По обе стороны от чипсета расположены коричневые слоты расширения. В нижний слот устанавливалась плата расширения для оперативной памяти. В два верхних – платы расширения для центральных процессоров.
Каждая процессорная плата содержала по три разъема Socket 8. Платы были развернуты зеркально по отношению к другу и могли быть установлены в любой разъем.
Посередине платы выделяются восемь слотов PCI, которые подключены к двум шинам. Ниже расположены EISA слоты. Пусть они и выглядят внушительно, но по скоростным характеристикам эта шина проигрывает PCI из-за малой частоты работы – 8.33 МГц.
В самый верхний разъем устанавливается специальная карта расширения с разъемами PS/2 для клавиатуры и мыши и парой COM-портов. Поэтому никаких привычных внешних разъемов вы здесь не увидите, разве что смотрящий вниз SCSI разъем для подключения жестких дисков.
Если присмотреться к этой PS/2 плате, можно заметить, что она произведена самой ALR. На плате присутствуют две наклейки, содержащие учетные номера данной детали по системе учета ALR и Unisys, то есть они взаимозаменяемые, как и остальные части сервера.
Помимо SCSI контроллера Adaptec 7800, на плате есть IDE контроллер с двумя разъемами IDE и FDD контроллер с одним разъемом. Для сравнения габаритов я положил рядом материнскую плату ASUS L1N64-SLI WS, которая, как вы помните, является основой платформы AMD – «Quadfather» или «Quad FX».
Внушительно, не правда ли? Плата оснащена несколькими диагностическими светодиодами, но самый интересный, на мой взгляд, – «Heartbeat» («Стук сердца»).
Данный светодиод отвечает за информирование о жизнедеятельности всей системы: если он моргает зеленым, значит, сердце системы бьется и все в порядке. Аналогичные светодиоды находятся на процессорных платах расширения.
Если присмотреться к материнской плате внимательнее, можно увидеть просто плату и специальные разъемы для установки дочерних плат расширения…
Тут не встретишь никаких сокетов, разъемов для оперативной памяти или силовой части, все это находится на специальных платах расширения, поэтому если вам удастся найти голую плату, либо сами платы расширения, то сразу скажу, что по отдельности они не представляют никакой ценности и интереса.
Но поскольку у меня оказался самый полный набор плат расширения ALR Revolution 6x6, расскажу о них подробнее. Начнем с процессорных.
Вот так выглядит одна из процессорных плат расширения. В материнскую плату допускается установка двух таких плат с суммарным количеством процессоров равным шести. Возможна также работа одного, двух, трех и так далее процессоров. На каждой из таких плат находятся съемные VRM модули, которые ставятся пропорционально числу процессоров.
Для работы процессоров с количеством меньше четырех штук необходимо использовать плату-терминатор, которая устанавливается во второй слот и выглядит следующим образом:
Общая схема подключения процессоров представлена ниже на схеме:
Система охлаждения CPU представлена массивными кулерами (изготовленными, кстати, в США), каждый из которых снабжен двумя скоростными вентиляторами.
И поскольку задача конструкции заключается в отведении 47 Вт тепла 24 часа в сутки, то шум, издаваемый 12-тью такими вертушками, ни с чем не сравним и похож на работу реактивных двигателей взлетающего самолета.
Данный сервер допускает использование памяти стандарта FPM (Fast Page Mode) как в форм-факторе SIMM 72 pin, так и в более прогрессивном DIMM 168 pin. Другие типы памяти, такие как EDO, не поддерживаются на уровне чипсета.
На фотографии ниже можно увидеть память объемом 128 Мбайт в обеих исполнениях:
Максимальный размер модуля может составлять 256 Мбайт, что в сумме с 16-тью разъемами обеспечит объем в четыре гигабайта, неплохо так для 1997 года. Память обоих типов устанавливалась в специальные райзер-карты.
Ниже на снимке приведена райзер-карта для установки оперативной памяти стандарта SIMM 72 pin с установленной памятью объемом 512 Мбайт.
Еще ниже пример того, что памяти много не бывает. Перед вами плата расширения под DIMM 168 pin и 16 модулей памяти суммарным объемом 2 гигабайта. Для современных целей такой объем ОЗУ малопригоден, но тогда это были просто колоссальные значения.
Для более скоростного режима работы оперативной памяти ее нужно было устанавливать по следующей схеме:
А вот так выглядят все четыре платы вместе:
На фото не хватает разве что второй процессорной райзер-карты. Но, как правило, в составе готового сервера всех таких плат вы не встретите, будем считать, что мне попался «Premium» вариант ALR, зато есть возможность оценить такие комплектующие. Сколько я не искал в сети, «ретро»-обзоры подобных систем так и не нашел, кроме обрывочных сообщений на форумах, поэтому решил написать сразу за всех.
И в завершение, чтобы было понятно, какого размера эти райзер-платы, приведу снимок одной из них рядом с материнской платой ASUS L1N64-SLI WS.
В комплект сервера входит графическая карта c GPU S3 Trio64V+, объем видеопамяти которой составляет целых два мегабайта. Это модель производства небезызвестной Number Nine, выпущенная в США.
BIOS Setup
После нажатия на кнопку «Power» мой шестипроцессорный монстр оживает и на экране монитора возникает долгожданный POST screen. Вот так выглядит начальный экран оригинального ALR Revolution 6x6:
А так выглядит POST screen не менее оригинального Unisys Aquanta HS6:
Как видите, в данной конфигурации установлено 2 Гбайт оперативной памяти и SSD Kingston SSDNow V300 объемом 60 Гбайт, а также IDE DVD-RW Pioneer DVR-109BK, и все комплектующие прекрасно чувствуют себя вместе. Достаточно нажать «F2» и мы попадем в рай, точнее BIOS
Но попадем мы туда не сразу. Кто видел, как древние ПК пересчитывают мегабайт за мегабайтом всю доступную оперативную память, те помнят, что процесс это небыстрый. А когда на борту целых два гигабайта, то можно и чайку успеть заварить. Дело в том, что сканирование всего доступного объема занимает чуть больше четырех минут времени, для 4-х Гбайт понадобится минут девять-десять. Нажатие клавиши «Esc» либо любой другой никак не прерывает данный процесс, так что приходится запасаться терпением.
Если посчитать количество сделанных мною в процессе тестирования «ресетов», то потраченного времени накопится около половины суток…
Выше представлен первоначальный экран BIOS Setup. Скажу сразу, множества разнообразных опций здесь нет, все выполнено в минималистическом стиле, так как главный принцип сервера это бесперебойная работа 24/7, 365 дней в году.
На снимке видно, что объем SSD диска (60 Гбайт), подключенного через IDE-SATA адаптер, равен 8.5 Гбайт. Это стандартное ограничение BIOS тех лет, но силами ОС нам становится доступен весь объем, без каких либо проблем, присущих такого рода ограничениям.
Еще можно заметить, что загрузка возможна либо с диска «A» (флоппи-дисковод), либо с диска «С» (жесткий диск). Выбрать загрузку с CD-ROM в BIOS невозможно, и поначалу я даже подумал, что опять придется доставать флоппик, но загрузочный диск в приводе определился в BIOS и система предложила начать загрузку с него. И это было приятной неожиданностью.
В закладке «Advanced» можно выбрать периферийные устройства, версию MPS 1.1 либо 1.4 – она же по умолчанию, вывод логотипа на начальный экран, и в конце – сброс конфигурации.
Последний пункт очень полезен, если у вас севшая батарея, либо она вообще отсутствует, так как в микросхеме ПЗУ может накопиться «мусор» и BIOS при запуске способен «сойти» с ума, поэтому эту опцию просто необходимо выбрать перед первым запуском.
В «Integrated Peripherals» можно увидеть следующие опции:
Это стандартные настройки включения/отключения портов и контроллеров. Одним словом, ничего необычного, как и в настройках ресурсов системы.
В следующем разделе «Security» можно задать пароль на вход в BIOS, включить запрет на доступ к гибкому floppy диску и проверку на вирусы. Тут все традиционно.
В разделе «Exit» присутствует стандартный набор выбора опций при выходе из BIOS Setup.
Как можно видеть, меню BIOS вполне привычно, ничего сверхъестественного в нем нет. Каких-либо настроек, отвечающих за поднятие напряжения на процессорах, либо выбор множителя или частоты шины FSB, мы не встретим, эта материнская плата относится к тому времени, когда все было принято делать руками.
Особенности архитектуры и принципы работы шести CPU
В данном случае нет особого смысла описывать тестовую систему, ведь Unisys Aquanta HS6 это и есть тестовая система. Остановлюсь лишь на ее отдельных компонентах.
Чтобы тестирование проходило гладко, я заменил дисковую подсистему на SSD. Kingston SSDNow V300 объемом 60 Гбайт был разбит на пять разделов, в которых было установлено три тестовых ОС и предусмотрен раздел для самих тестов. Хотя была идея использовать RAID 0 массив из самых «скоростных» SSD объемом 8 Гбайт каждый.
Но в последний момент я отказался от этой идеи и решил пока оставить парочку «суперскоростных» SSD в покое, хотя готов это сделать при наличии хорошей идеи.
С учетом того, что изначально сервер поставлялся с шестью процессорами Pentium Pro Black, для контраста было решено добавить шесть процессоров Pentium Pro Gold c частотой 200 МГц и кэш-памятью второго уровня 256 Кбайт. Такой объем как раз вчетверо отличается в меньшую сторону, заодно будет интересно проверить влияние кэша: шесть мегабайт – против полутора.
А вот и коллективная фотография принимающих участие в тестировании процессоров; впрочем, еще немного добавить и можно сделать неплохой шахматный стол
Но перед началом тестов мы остановимся на принципе взаимодействия шести процессоров в данной системе. Чтобы преодолеть ограничения Intel на построение системы с количеством ЦП больше четырех, инженеры ALR при поддержке Unisys предложили использовать схему взаимодействия шести процессоров с применением арбитража:
Теория, лежащая в основе этой архитектуры, так же проста, как и мощна. Внутри новой шестипроцессорной системы находятся две процессорных платы «Tri-CPU card» (A и B на рисунке). Каждая из них представляет собой независимую трехпроцессорную SMP-шину, оснащенную всеми логическими средствами защиты процессора «Active CPR», и обладает встроенной в каждую трехпроцессорную плату технологией автоматического восстановления после ошибки. Эти две платы подключаются к шине SMP с 64-битной четностью.
К шине подключена отдельная плата со слотами для оперативной памяти с чередованием с четырьмя каналами, поддерживающая постоянную полосу пропускания данных на уровне 533 Мбайт в секунду. Такой пропускной способности достаточно для поддержки двух полноскоростных шин PCI, а также моста шины EISA.
Выше на снимке изображен типичный четырехпроцессорный арбитраж с использованием стандартного логического идентификатора Pentium Pro.
Чтобы преодолеть логические ограничения процессоров Pentium Pro, шестипроцессорные серверы используют уникальную расширенную конфигурацию арбитража шины, называемую Dynamic Orchestration («Динамическая оркестровка»). Лучший способ понять, как работает эта система – сравнить ее с типичной четырехпроцессорной архитектурой SMP. В системе с четырьмя процессорами арбитраж шины реализован по принципу «круговой проверки» – у каждого процессора есть равные права на шину и доступ идет упорядоченным образом (как на рисунке выше).
Например, если всем процессорам необходим доступ к шине, CPU 0 получит доступ первым, затем CPU 1, потом CPU 2 и, наконец, CPU 3, и только потом доступ к шине вернется к CPU 0.
Для целей этого четырехстороннего арбитража ЦП идентифицируются с использованием двухбитового идентификатора ID кода. Шестипроцессорное решение заимствует эту схему с одним важным изменением. Так, внутри каждой трехпроцессорной (Card A и Card B) платы отдельные CPU идентифицируются с помощью двухбитного идентификационного кода. Это приводит к четырем возможным комбинациям, хотя необходимы только идентификационные коды от 0 до 2. Специальная микросхема на каждой трехпроцессорной карте обрабатывает арбитраж, следуя «круговой схеме», используемой в четырехсторонней системе.
В этом случае четвертый процессор заменяется на своего рода «фантомный», который фактически представляет собой другую трехпроцессорную карту. Схема такой работы представлена ниже:
Такой шестипроцессорный арбитраж использует стандартное логическое соглашение настоящего процессора Intel Pentium Pro с «фантомным» процессором.
Если бы всем шести процессорам требовался доступ к шине, то CPU 0 на карте A (первая трехпроцессорная карта) получал бы доступ первым, а затем CPU 1 на карте A и потом CPU 2 на карте A. После этого доступ передавался на карту B (вторая трехпроцессорная карта, представленная «фантомным» процессором). Затем CPU 0 на карте B получит доступ к шине, далее CPU 1 на карте B и, наконец, CPU 2 на карте B. После этого доступ перейдет обратно на карту А, и весь процесс начнется заново.
Этот многопроцессорный арбитраж управляется расширенным арбитром шины с использованием выделенного преобразователя идентификатора кластера. Такая схема обеспечивает равный и сбалансированный доступ к шине данных для всех шести процессоров при использовании стандартных логических соглашений четырехпроцессорной схемы. Все ЦП могут эффективно взаимодействовать при помощи симметричного доступа и масштабироваться в соответствии со стандартами параллельной шины, легко преодолевая многие ограничения такой схемы.
Подобная конфигурация расположения процессоров с динамическим многопроцессорным арбитражем дает еще одно важное преимущество – совместимость версий MP Spec v 1.1 и 1.4. Как следствие, шестипроцессорный сервер обеспечивает стабильную совместимость со всеми основными сетевыми операционными системами и приложениями того времени.
Выше на рисунке представлена шестипроцессорная схема серверной платы ALR Revolution 6x6 и ее клонов. Благодаря такому подходу стало возможным появление 8-ми, 10-ти и более процессорных систем.
Выстраивая шахматную доску из различных моделей Pentium Pro, я думал, что больше по размерам процессора мне не найти. Даже 32-х ядерный AMD Ryzen Threadripper 2990WX рядом с Intel Pentium Pro не кажется таким уж и большим.
Пока мой товарищ не прислал мне еще одну фотографию:
Слева на фото представлен инженерный вариант Xeon Gold 6142 для сокета LGA 3647, справа – еще один инженерный вариант, но уже Intel Xeon Phi в таком же конструктиве LGA 3647.
Как видите, история возвращается на круги своя, и, возможно, все последующие процессоры не будут помещаться на ладонь руки. Хотя моделям CPU в исполнении LGA 2066 еще далековато до Intel Pentium Pro.
Разгон шести ядер вместе и по отдельности
Нечасто производители серверного оборудования предоставляют возможность выбора работы процессоров или оперативной памяти в нестандартных условиях или разгоне. Из своего личного опыта могу сказать, что мой любимый производитель такого рода оборудования – компания ASUS, ее материнские платы для рабочих станций в большинстве своем дают возможность выбора, что подтверждалось в предыдущих статьях цикла.
С ALR Revolution 6x6 все несколько сложнее. Если бы возможность разгона на 100% зависела от возможностей BIOS материнской платы, то о разгоне можно было бы забыть. Но на помощь пришли они – джамперы.
Джампер – лучший друг оверклокера (с). Народная мудрость. А еще хорошо, когда они есть. Если обратиться к руководству по материнской плате, можно увидеть такую табличку выбора множителя CPU с помощью комбинаций переключателей.
Итого 14 вариантов: половина отвечает за выбор частоты FSB, которая может работать в двух режимах (60 и 66 МГц), остальные отвечают за множитель.
В результате Pentium Pro со свободным множителем гипотетически можно разогнать до 366 МГц. Но боюсь, для таких цифр потребуется, как минимум, жидкий гелий. Аналогичная табличка нанесена на текстолит самой материнской платы сервера.
Зная предельные возможности разгона процессоров Intel Pentium Pro, которые при использовании жидкого азота доходят до 300 МГц, а при воздушном охлаждении уже хорошо, если с 200 МГц берут 233 МГц, можно говорить о том, что если пойдет и дальше, то это однозначно успех. Но поскольку экземпляров у меня шесть и никакой селекционный отбор не применялся, то главный критерий в данном случае это удача.
В результате шесть Intel Pentium Pro c частотою 200 МГц и кэш-памятью второго уровня 1 Мбайт при выставлении джамперов 66.6 х 3.4 заработали на частоте 233 МГц. Это 16.5% с каждого ядра или суммарно +99% к производительности всей системы. Или почти даром седьмой процессор. Ниже приведена ссылка на валидацию CPU-Z.
К сожалению, на большее их не хватило.
Далее, выдавив полтюбика термопасты на новую партию испытуемых, а пасты нужно для таких площадей прилично, я установил радиаторы на шесть CPU Intel Pentium Pro с частотой 200 МГц и кэш-памятью 256 Кбайт, то есть вчетверо меньшей по объему. И забыв вернуть джамперы на место с предыдущего старта, я увидел на экране 233 МГц.
Следующим шагом была частота 240 МГц по формуле 60 х 4, и она была взята! Удача и в этот раз не подвела.
А это уже плюс 20% производительности к каждому процессору. Следующей отметкой должны были стать 266 МГц, но, увы, меня ждал черный экран. Эта частота так и не покорилась шести самураям. Но даже 240 МГц – приличная цифра для такого количества CPU. Осталось выяснить последнее – производительность в тестах.
Тестовый стенд
Для проведения тестов была собрана следующая конфигурация:
- Процессоры:
- 6 x Pentium Pro 200 МГц, L2 1024 Кбайт;
- 6 x Pentium Pro 200 МГц, L2 256 Кбайт;
- Материнская плата: Unisys Aquanta HS6 (10140) чипсет Intel 450GX (6 x Socket 8);
- Видеокарта: PNY GeForce2 MX400 PCI 64 Мбайт (Forceware 93.21);
- Накопитель SSD: Kingston SSDNow V300 60 Гбайт.
Тестирование производительности проводилось в «Windows Whislter .Net Advanced Enterprise Server, Build 2600, Service Pack 2, 3 in 1» как-то так edition с помощью следующего ПО:
- Super Pi mod. 1.5XS (задача 1M);
- PiFast v.4.1;
- wPrime v.1.43;
- HWBOT Prime v.0.8.3;
- CPU-Z v.1.87.0;
- WinRAR x86 v. 5.40;
- 7-Zip v.16.04;
- AIDA64 5.50.3600;
- SiSoftware Sandra 2004 SP2;
- Cinebench 2003;
- Cinebench R10.
Результаты тестирования
Для разогрева начнем с пары однопоточных тестов: Super Pi и PiFast.
Super Pi mod. 1.5XS
Время, минуты
Меньше – лучше
Включите JavaScript, чтобы видеть графики
Если сравнить производительность Pentium Pro с тактовой частотой 200 МГц и просто Pentium c частотой 100 МГц, видно более чем двукратное превосходство серверного варианта Intel. Ясно, что объем кэш-памяти второго уровня оказывает влияние на итоговый результат. Процессор с частотой 240 МГц не смог одолеть своего коллегу с частотой 233 МГц и более емким кэшем второго уровня.
В то же время дотянуться до производительности Pentium II с частотой 233 МГц (Klamath) не удалось ни одному представителю Pentium Pro. А победителем данного раунда становится разогнанный до 300 МГц с применением экстремального охлаждения Pentium I, несмотря на отсутствие кэш-памяти второго уровня.
PiFast v.4.1
Время, секунды
Меньше – лучше
Включите JavaScript, чтобы видеть графики
В данном тесте 300 МГц частоты не принесли Pentium-I победы и даже Pentium Pro обогнал равночастотный Pentium II (Klamath). Казалось бы, два похожих теста, но разные алгоритмы. Но эти тесты были для наглядного примера, естественно, вся СИЛА ALR Revolution 6x6 в поддержке многопоточности, вот тут будет, где развернуться.
Для всех указанных ниже тестов я старался подобрать близкие по производительности результаты с разным количеством физических процессоров в системе, чтобы было легче представить, какая реальная производительность у этой интересной машины. Результаты брались из базы данных HWBOT.org.
wPrime v.1.43
Время, секунды
Меньше – лучше
Включите JavaScript, чтобы видеть графики
Ядер, как и физических процессоров, много не бывает, не правда ли? Шесть Pentium Pro в своем штатном состоянии оказались быстрее, чем пара самых первых Pentium III с частотой 500 МГц в форм-факторе Slot 1, и даже быстрее, чем пара «Зионов» с частотой 550 МГц и увесистым L2 кэшем объемом 2 Мбайт в форм-факторе Slot 2. Но один 1 ГГц AMD Athlon с ядром Thunderbird в исполнении Socket 462 быстрее.
Разгон каждого процессора на 16.5% (или +1 дополнительный ЦП) приводит к тому, что они обгоняют уже пару Pentium III E с тактовой частотой 600 МГц на ядре Coppermine-256. А шесть Pentium Pro с L2 256 Кбайт практически на равных могут соперничать с Celeron с частотой 2.4 ГГц на ядре Northwood, который появился в продаже в марте 2003 года по цене $127. Если посчитать, то с момента появления в продаже ALR Revolution 6x6 прошло всего каких-то шесть лет. Прогресс никого не щадит, даже таких монстров, как ставший героем обзора.
HWBOT Prime v.0.8.3
Итоговый балл
Больше – лучше
Включите JavaScript, чтобы видеть графики
Запуск данного Java теста стал возможным благодаря моей чудо-OC Windows. Результаты, конечно, очень забавные, по-другому их назвать никак нельзя Пропустим сравнение с двумя Pentium III Xeon и взглянем на соседство шести Pentium Pro с частотой 200 МГц и Samsung Galaxy S3 на уже престарелом ARM Cortex-A9 с четырьмя ядрами с частотой 1200 МГц. Что уж говорить о современных флагманах, которые не оставят и камня на камне от суперсервера тех лет. А если такую производительность да поделить на массу устройств, то у ALR Revolution 6x6 в таком соотношении точно не будет шансов.
Еще очень симпатично смотрится парочка в виде процессора Intel Atom Z2480 для мобильных устройств с частотою 2 ГГц, одним ядром и технологией Hyper Threading, и разогнанный до предела Pentium Pro с частотой 240 МГц. Этот «малыш» размером 12 х 12 мм и с TDP 3 Вт идет на равных с шестью процессорами из прошлого. В остальном комментарии излишни.
WinRAR x86 v. 5.40
Кбайт/с
Больше – лучше
Включите JavaScript, чтобы видеть графики
Показатели быстродействия в архивации данных у тестовой системы более чем достойные. Удалось обогнать даже двухпроцессорные системы с оперативной памятью, которая намного опережает по своим скоростным характеристикам древнюю Fast Page Mode Memory.
7-Zip v.16.04
Итоговый результат, MIPS
Больше – лучше
Включите JavaScript, чтобы видеть графики
В данном тесте тоже можно констатировать, что все шесть процессоров не ударили в грязь лицом. Даже на фоне двух Pentium II Overdrive 333 МГц они смотрятся хорошо. Кэш-память также вносит свою лепту в итоговый результат, как и частота FSB, которая не позволила шести Pentium Pro 240 МГц подняться над собратьями.
AIDA64 5.50.3600
Ниже на рисунке представлена часть скриншота из AIDA64. Кликните для увеличения.
Чтение из памяти, Мбайт/с
Больше – лучше
Чтение из памяти у данной системы на очень хорошем уровне, чего нельзя сказать о скорости записи в память.
Запись в память, Мбайт/с
Больше – лучше
CPU Queen, баллы
Больше – лучше
Тестовая система оказалась в 7 с лишним раз быстрее Pentium c частотой 166 МГц и в 3.15 раза быстрее сервера Compaq ProLiant 800 с парой Pentium Pro 200 МГц.
FPU Julia, баллы
Больше – лучше
Аналогичным образом шесть разогнанных до 240 МГц процессоров быстрее сервера Compaq ProLiant 800 с парой Pentium Pro 200 МГц.
И, конечно же, тест Cache and Memory Benchmark. Слева направо: Pentium Pro 200 МГц (L2 1024 Кбайт), Pentium Pro @233 МГц (L2 1024 Кбайт) и Pentium Pro @240 МГц (L2 256 Кбайт).
SiSoftware Sandra 2004 SP2
Arithmetic benchmark, MIPS
Больше – лучше
Multi-media benchmark, it/s
Больше – лучше
Cinebench 2003
Баллы
Больше – лучше
Включите JavaScript, чтобы видеть графики
К вопросу о том, на чем лучше производить финальный рендеринг.
Cinebench R10
Баллы
Больше – лучше
Включите JavaScript, чтобы видеть графики
Очень отзывчивый тест. Жаль, что не удалось найти схожих результатов, но из графика видно, что итоговый показатель процессора зависит как от тактовой частоты, так и объема кэш-памяти второго уровня.
Заключение
Настало время подвести черту под очередным проектом. Я постарался в деталях рассказать об уникальном суперсервере производства ALR. В конце 1990-х такая производительность была на грани фантастики, тогда обычный Pentium-I для многих был недостижимой целью, а основная масса играла на Dendy
Сейчас же это просто музейный экспонат, с мощностью, сопоставимой с одним ядром любого современного мобильного телефона. Остается загадкой, что будет через следующие двадцать лет, возможно 32 ядра AMD Ryzen Threadripper второго поколения в те времена начнут казаться чем-то нелепым.
Я же хочу поблагодарить интернациональную команду единомышленников, которая помогла мне осуществить данный проект, но точку в нем мы пока не ставим (пошел искать корпус для этого монстра и обдумывать еще пару идей на будущее).
Бонус-раунд при поддержке mentoza
При завершении работы над данным материалом я думал, что на «Заключении» все и закончится, а ведь когда набиралось «вступление», то в нем фигурировала такая мысль «… сравнение с производительностью современного HEDT шестиядерника».
Впрочем, еще при начале работы над проектом я попросил обладателей шестиядерных процессоров Intel уделить 30 минут своего времени и прислать мне результаты для сравнения с шестью Pentium Pro. Мне, например, было очень интересно узнать, во сколько раз увеличилась производительность за двадцать с лишним лет. В моем распоряжении есть лишь «народный» ПК на базе Core i7-2600K, за которым набираются эти строки, а у знакомых ничего больше четырех ядер нет. Но один оверклокер на просторах конференции все же нашелся , спасибо mentoza за предоставленные результаты Intel Core i7-7800X.
В основу его тестовой платформы вошли:
- Процессор: Intel Core i7-7800X 3500 МГц, LGA 2066, Hyper Threading – Off;
- Материнская плата: ASUS Prime X299-A;
- Оперативная память: DDR4 3600 МГц 4 x 8 Гбайт, CL-19, Quad Channel, XMP – On;
- Операционная система: Microsoft Windows 10 x64, установленная на NVME SSD.
Как видите, в качестве оппонента выступает вполне современная HEDT платформа с шестиядерным процессором Skylake-X. Технология HT намеренно была отключена, чтобы сравнить шесть ядер с шестью процессорами. Платформа работала в режиме по умолчанию, без всякого разгона. Итак, настало время узнать, во сколько раз изменилась производительность за 21 год!
Тут мы вернемся к ранее приведенным тестам, добавив к результатам показатели Core i7-7800X. Надеюсь, скрипт движка сайта правильно отрисует такие большие проценты.
Super Pi mod. 1.5XS
Время, секунды
Меньше – лучше
Включите JavaScript, чтобы видеть графики
PiFast v.4.1
Время, секунды
Меньше – лучше
Включите JavaScript, чтобы видеть графики
wPrime v.1.43
Время, секунды
Меньше – лучше
Включите JavaScript, чтобы видеть графики
HWBOT Prime v.0.8.3
Итоговый балл
Больше – лучше
Включите JavaScript, чтобы видеть графики
WinRAR x86 v. 5.40
Кбайт/с
Больше – лучше
Включите JavaScript, чтобы видеть графики
7-Zip v.16.04
Итоговый результат, MIPS
Больше – лучше
Включите JavaScript, чтобы видеть графики
AIDA64 Cache and Memory Benchmark
CPU-Z 1.87.0 Benchmark
Итоговый результат, баллы
Больше – лучше
Cinebench 2003
Баллы
Больше – лучше
Включите JavaScript, чтобы видеть графики
Cinebench R10
Баллы
Больше – лучше
Включите JavaScript, чтобы видеть графики
В качестве дополнительной информации для размышления приведу итоговое время выполнения данного теста. Так, Intel Core i7-7800X выполнил финальный рендеринг ровно за 20 секунд, а шести Pentium Pro для выполнения той же задачи понадобилась 21 минута и 14 секунд. Вот так!
Итоги
Вот, пожалуй, и все, все обещания выполнены, результаты оказались весьма интересными, есть над чем поразмыслить и задуматься. Лично мне добавить к ним больше нечего. Надеюсь, потраченные на данный проект полгода времени были использованы не напрасно.
Остается открытым вопрос с Intel Pentium II Overdrive 333 МГц, но надежды на продолжение истории я все же не теряю.
Всех оверклокеров и энтузиастов с наступающим 2019 годом
Впереди будет много интересного!
Страницы материала
Лента материалов раздела
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила