О сборке малошумного сервера начального уровня из общедоступных комплектующих
Эта работа была прислана на наш "бессрочный" конкурс статей.
Введение
В сознании многих пользователей сервер ассоциируется с высоченным шкафом или хотя бы с корпусом типа Big Tower. Лицезрение этой конструкции вызывает уважительные мысли о мощи и надежности информационных технологий. Но внешность бывает обманчивой. Случается так, что вся эта махина выполняет функции, которые вполне под силу маленькой китайской коробочке с встроенным Linux-ом, Web-интерфейсом и ценой от 1500 до 6000 рублей за штуку. А если открыть корпус сервера, то иногда обнаруживается... пустота - как в старом шкафу, из которого забрали одежду. Так бывает тогда, когда сервер выполняет в основном представительские функции.
Эта статья не о том, как произвести впечатление на доверчивого пользователя. Разговор пойдет о том, как собрать компактный файловый сервер, достаточный для обслуживания 100-мегабитной сети класса С из 50-200 компьютеров. В литературе такие серверы часто называют серверами уровня подразделения. Они занимают ценовой диапазон от 45000 до 75000 рублей - за счет применения нескольких процессоров, дисков SCSI с возможностью горячей замены и т.п. Но мы не будем гнаться за наворотами и вместо этого построим сервер начального уровня, который должен обеспечить надежное хранение данных объемом от 100 гигабайт и выше, но от которого не требуется особенно высокая производительность. Бонус заключается в том, что мы попадем в ценовой диапазон от 30000 до 45000 рублей и, кроме того, получим малошумную машину, которую можно будет поставить в одну комнату с сотрудниками. Такой сервер подойдет не только для большой сети, но и для небольшой рабочей группы, а при необходимости может выполнять роль рабочей станции с повышенной надежностью хранения данных.
реклама
Основное внимание будет уделяться вопросам надежности и стоимости, а также подбору комплектующих для достижения оптимальной производительности; впрочем, обсуждение последнего вопроса не следует рассматривать как исчерпывающее. В отличие от многих статей, посвященных серверам - здесь не будет тестов на скорость выполнения запросов. Для сервера начального уровня это не столь актуально, потому что к его производительности никакие особенные требования не предъявляются. Т.е. речь идет о задачах, с которыми справляется любой более или менее современный компьютер - такие, как NAT, электронная почта и файловый архив, а также корпоративные Web-сервер и база данных на движке с эпизодической рабочей нагрузкой. А если нагрузка в сети такова, что сервер начального уровня не справляется с поставленными задачами - то нужен полноценный сервер уровня подразделения или организации со всеми вытекающими из этого финансовыми последствиями.
Начнем с небольшой обзорной экскурсии.
1. О серверах и не только о них
реклама


На сиcтемной плате есть два 64-битных и четыре 32-битных разъема PCI. Один из 32-битных разъемов занят платой с видеоадаптером и одноканальным контроллером SCSI. Блок питания на 250 ватт, но от Дельты, что как раз достаточно для сервера на Pentium III. Вентилятор на блоке питания шумит умеренно, но ему помогает оборотистый и шумный вентилятор на задней стенке корпуса.

Подготовка сервера к работе автоматизирована до предела. Если забудешь подключить клавиатуру или что-то еще - BIOS выдает подробные разъяснения на английском. Для форматирования диска и установки операционной системы применяется диск SmartStart. Загружаешься с него, вводишь тип операционной системы и серийный номер, ставишь ее CD - и теперь можно отдыхать - через пару часов сервер будет готов к работе.
Через два часа полета возвращаемся в обыденную действительность. Диск SmartStart годится только для первой установки т.к. он стирает винчестер целиком. Поэтому повторную установку (она потребовалась через месяц экспериментов с новой операционной системой) я делал как обычно. И тут система благополучно вылетела в синеву. Оказывается, диск SmartStart при установке незаметно подкладывает ей специфичный драйвер SCSI. Драйвер пришлось искать на сайте Compaq. Мне до сих пор непонятно - почему не предупредили?
Другое разочарование наступило, когда я принялся искать на сервере порт USB. Его там не было. Ну, это не беда, можно добавить. А когда потребовалось установить еще один диск SCSI, пришлось лезть в маленькую корзину, где два места из трех уже были заняты. Никакого вентилятора рядом с корзиной нет, что (парадокс!) не мешает дискам оставаться почти совершенно холодными. Надо отдать должное инженерам Compaq - корпус устроен так, что значительная часть воздуха втягивается в него через корзину с винчестерами. Но вряд ли охлаждение будет столь же эффективным, если убавить обороты шумного вентилятора на задней стенке системного блока. Еще одно лыко в строку - никаких фильтров нет, поэтому через несколько месяцев платы покрываются густой серой пылью.
3. Соберем сервер по собственному проекту

В качестве примера рассмотрим корпус 3R System R101. Сталь 0.8 мм, два корпусных вентилятора на 120 мм каждый, один из которых продувает пять установочных мест для винчестеров внизу корпуса. Три термопары, шестиступенчатая регулировка вентиляторов вручную или на автомате, настраиваемое отключение при перегреве в диапазоне 50-85 градусов с шагом 5. И полная бесшумность при работе корпусных вентиляторов на минимальной скорости. Что еще нужно для сервера? Разве что иметь еще один вентилятор на боковой стенке около процессора :).
реклама

Обратите внимание на то, что установочные места для винчестеров находятся за вентилятором. Это очевидное, но почему-то не слишком распространенное решение позволяет отказаться от установки дополнительных кулеров на каждом винчестере.
При более близком знакомстве становятся заметны недостатки:
- Небольшая глубина корпуса не позволяет поставить туда материнскую плату fullATX (305x285, в таком формате часто выпускаются двухпроцессорные серверные платы). Входит только стандартный ATX (305*244).
- Подсос воздуха идет через отверстие внизу лицевой панели, которое непропорционально мало по сравнению с диаметром вентилятора и к тому же частично перекрыто большой платой автоматики.
- Нет фильтра от пыли, поэтому сервер лучше держать на столе, а не на полу.
- Отсутствуют средства мониторинга корпусных вентиляторов. Нельзя узнать, на какой скорости они вращаются и вращаются ли они вообще (впрочем, об этом можно судить косвенно, если померить термопарой нагрев винчестера).
- Абсолютно бесшумной является только первая скорость. На второй и третьей скорости корпусные вентиляторы поскрипывают из-за того, что их регулировка - импульсная. Это досадно, потому что даже на третьей скорости шум воздуха едва заметен - он становится сильным только на четвертой и пятой скоростях. Поэтому имеет смысл отказаться от автоматики и поставить вентиляторы на реобас.
- Требуется перенастройка автоматического отключения, т.к. изначально оно настроено на температуру 65 градусов.
- При нажатии кнопок управления на лицевой панели плата автоматики громко и противно пищит. Отключить пищалку можно только на самой плате, для чего придется снять переднюю стенку.
- Кнопка Reset умело замаскирована под кнопку управления.
Инструкцию по установке корпуса и настройке автоматики можно найти на сайте 3R System . Там же есть описания альтернатив R101, которые выглядят не столь эффектно, но зато лучше продуманы с конструктивной точки зрения. Интересна модель с фильтром от пыли 3R AIR, а также более дешевая 3R NEON Light, у которой нет столь большой и бестолковой платы автоматики. Среди корпусов других производителей можно отметить недорогой, но качественный ASUS Ascot 6AR/300, а также разнообразную продукцию Chieftec.


Основные потребители +12V - это процессор и внешние накопители. С учетом КПД регулятора напряжения на системной плате, для Pentium-2400С резервируется 8A (96 ватт), каждый внешний накопитель берет до 1A. У меня 3 диска и 1 CD-RW. Еще пара ампер уходит на питание вентиляторов, платы автоматики и разной мелочи на системной плате и видеокарте. В сумме получается 14A, в то время как блок питания дает до 12A. Его спасает от перегрузки только то, что процессор и накопители не берут свой максимальный ток одновременно.


Характеристики малошумных жестких дисков с объемом до 160-200 гигабайт собраны здесь: Винчестеры с пониженным шумом и тепловыделением. Многие производители предлагают диски большего объема - вплоть до 400 гигабайт; такие диски обычно шумят на 2-3 dB сильнее, чем соответствующие модели небольшого объема.Самая последняя новость в мире Serial ATA - это поддержка очереди команд для оптимизации перемещения головок. По оценкам Intel и Seagate, очередь команд дает 30% рост производительности и сокращает нагрузку на привод головок накопителя. В версии SCSI эта технология называется TCQ (Tagged Command Queuing) и реализуется аппаратно; Serial ATA диски WD Raptor реализуют TCQ на микропрограммном уровне. Для недорогих дисков Serial ATA разработана облегченная версия NCQ (Native Command Queuing), которая на данный момент имеется в винчестерах Seagate Barracuda 7200.7 ST3160027AS (160Gb) и ST3200822AS (200Gb), Barracuda 7200.8 (250, 300, 400Gb), Maxtor DiamondMax 10 (80-300Gb) и MaxLine III (300, 350Gb).
Очередь команд нуждается в соответствующей поддержке со стороны контроллера Serial ATA, с которой дело пока обстоит не густо - она имеется только на некоторых самых современных системных платах и внешних контроллерах для шины PCI. В частности, Intel обеспечила поддержку NCQ в чипсетах для Socket 775 с южным мостом ICH6R. Определенные надежды могут быть связаны и с имеющимися системными платами и контроллерами, на которых установлены чипы Silicon Image Sil3512 и Sil3114, т.к. для этих чипов производитель обещает выпуск драйверов с программной поддержкой NCQ.
Чтобы собрать надежную дисковую систему, берем два недорогих диска Serial ATA (в нашем случае это будет Seagate Barracuda 7200.7) и создаем на них отказоустойчивый массив по технологии RAID 1. Это значит, что информация продублирована на обоих дисках и выход из строя одного из дисков не приводит к потере данных. Такое решение дешевле, чем установка одного соответствующего по объему диска SCSI, хотя и будет уступать ему по производительности. Кроме того, выбранные нами диски не рассчитаны на круглосуточную работу - поэтому можно ожидать, что срок их службы будет ограничен и диски придется периодически менять. Процедура замены выглядит таким образом: достаем отказавший диск, ставим новый и запускаем встроенную в контроллер RAID процедуру копирования для восстановления массива RAID 1. На время замены диска и восстановления массива сервер выводится из эксплуатации.
Производительность дискового массива RAID 1 будет выше производительности одиночного диска, если контроллер реализует чередование обращений к дискам - примером может служить Архитектура 3Ware TwinStor. Контроллер с чередованием распределяет запросы на чтение данных между дисками, исходя из текущего положения блоков магнитных головок, при этом чтение с двух дисков может выполняться одновременно, т.к. каналы Serial ATA независимы друг от друга.Но даже с учетом чередования, производительность нашего массива RAID 1 недалеко уходит от уровня дисковой подсистемы обыкновенного бытового компьютера. Это приемлемо только при умеренной рабочей нагрузке; если же предполагается интенсивная работа с промышленными базами данных, системами потокового видео и т.п., то производительности может элементарно не хватить, не говоря уж о том, что отказавшие от непомерной нагрузки диски придется менять, как перчатки.
Для повышения производительности вместо дисков на 7200 RPM можно использовать диски WD Raptor на 10000 RPM (но это будет дороже, чем один диск SCSI). Более дешевый способ поднять производительность - поставить диски с NCQ и подобрать соответствующий контроллер.
Дисковые массивы RAID 1 отличаются простотой и надежностью, но не рекордно высокой производительностью. Для создания скоростных дисковых массивов применяется технология RAID 0 с чередованием секторов на двух или нескольких дисках. В результате получается один большой логический диск, производительность которого растет почти пропорционально числу физических дисков. Благодаря высокой производительности, технология RAID 0 активно обсуждается в компьютерных журналах. Но для наших целей она неинтересна, т.к. снижает и без того невысокую надежность хранения данных на бытовых дисках. Зато может пригодиться комбинированная технология RAID 0+1 или RAID 10, когда заводится четыре диска и на одной паре делается чередование секторов, а на другой - зеркало первой пары. Эта комбинация сочетает высокую производительность и отказоустойчивость. Более экономичная технология Intel MST (Matrix Storage Technology), поддержанная также RAIDCore/Broadcom, позволяет сочетать технологии RAID 0 и RAID 1 всего на двух дисках. Для этого на каждом диске создаются два раздела - один для массива RAID 0 и другой для массива RAID 1. Резервирование обеспечивается только для раздела RAID 1.
Кроме упомянутых простых вариантов RAID, существует большое количество более сложных, среди которых наиболее известен RAID 5. В массив RAID 5 объединяются несколько дисков c чередованием секторов (от 3 и более), из которых только один содержит избыточную информацию, получаемую путем суммирования секторов с данными по XOR. Эта технология обеспечивает отказоустойчивость при меньших накладных расходах на резервные диски. RAID 5 имеет невысокую производительность при записи, в то время как производительность при чтении примерно соответствует RAID 0.
Производительность увеличится, если хотя бы один контроллер (RAID или гигабитный сетевой) будет подключен в обход PCI на более скоростную шину. На эту тему есть гигабитные сетевые чипы Intel 82547EI для CSA (266 MB/s) и Marvel Yukon 88E8050 для PCI Express X1 (512 MB/s). С дискретными чипами Serial ATA RAID дело обстоит сложнее - они задействуют cкоростные расширения шины PCI, которые имеются только на серверных платах.
Пропускная способность PCI становится недостаточной при создании массивов из большого числа дисков, например, по технологии RAID 0+1. Походящий для них уровень производительности могут обеспечить контроллеры, встроенные в чипсет - если они подключаются к скоростным внутренним шинам. Но и здесь можно встретить контроллеры, полученные простым встраиванием в чипсет дискретных решений с интерфейсом PCI. Вот хороший обзор на эту тему: Chipset Serial ATA and RAID performance comparison.
Более продвинутые технологии, такие как RAID 5, реализуются внешними контроллерами, в их числе - Promise FastTrak S150 SX4 и различные платы с применением оптимизированных под RAID 0 чипов Silicon Image Sil3112, Sil3114 и аппаратного XOR-процессора. Здесь речь идет об аппаратно-программном решении, т.к. XOR-процессор берет на себя вычисление контрольных сумм RAID 5. Для ускорения работы на плату устанавливается буферная память и скоростные расширения шины PCI. Многие контроллеры допускают установку и на десктоповую шину PCI, но их производительность в этом режиме будет не особенно высокой.
Десктоповая шина PCI (32 bit, 33 MHz, 133 MB/s) не подходит для скоростных контроллеров, т.к. при объединении диcков в массив RAID скорость передачи данных суммируется. К примеру, теоретическая скорость передачи данных с пяти дисков Serial ATA в массиве RAID 5 будет равна 600 (4*150) MB/s, реальная скорость доходит до 220 MB/s: см. Тесты масштабирования RAID 5: от трёх до восьми жёстких дисков.
Полностью аппаратный RAID встречается в дорогих контроллерах с микропроцессорами, применение которых оправдано при наличии большого числа дисков, повышенных требований к готовности и т.п. Что же касается массива RAID 1, то здесь можно ограничиться материнской платой со встроенным контроллером - именно это решение будет оптимальным по стоимости для платформ Pentium 4 и Athlon 64. Вот известные мне чипы Serial ATA RAID, которые применяются (или могут применяться) на материнских платах:
Чип | Число дисков Serial ATA в массиве | Чередование в RAID 1 | Очередь команд | Внешняя шина | |||||
RAID 0 | RAID 1 | RAID 0+1 | RAID 5 | ||||||
ATI SB800 (южный мост чипсетов на ядрах RX480/RS480/RS400) | 2-4 | 2 | 4 | - | н/д | н/д | н/д | ||
Broadcom BCM 5770R (RAIDCore BCM4452-H) | 2-4* | 2-4* | 2-4* | 3-4* | н/д | - | PCI-X | ||
Broadcom BCM 5770 (RAIDCore BCM4852-H) | 2-8* | 2-8* | 2-8* | 3-8* | н/д | - | PCI-X | ||
Intel ICH5R (южный мост Intel E7525/E7520/E7320/875/865/848) | 2* | 2* | - | - | + | - | 266 MB/s | ||
Intel 6300ESB (южный мост Intel E7525/E7520/E7320/E7210) | 2* | 2* | - | - | н/д | - | 266 MB/s | ||
Intel ICH6R(RW) (южный мост Intel 925/915) | 2-4* | 2* | 2(MST)* | - | + | NCQ | 600 MB/s | ||
NVidia nForce3 Ultra, 250Gb, 250 (северный мост) | 2*# | 2*# | - | - | + | - | 300 MB/s | ||
NVidia nForce3 Ultra, 250Gb, 250 + PHY-контроллер | 2-4*# | 2*# | 4*# | - | 600 MB/s | ||||
Marvel 88SX5041 (4 порта Serial ATA) | Зависит от драйвера RAID | TCQ | PCI-X | ||||||
Marvel 88SX5081 (8 портов Serial ATA) | Зависит от драйвера RAID | TCQ | PCI-X | ||||||
Marvel 88SX6041 (4 порта Serial ATA II) | Зависит от драйвера RAID | TCQ/NCQ | PCI-X | ||||||
Marvel 88SX6081 (8 портов Serial ATA II) | Зависит от драйвера RAID | TCQ/NCQ | PCI-X | ||||||
Promise PDC20371 (FastTrak S150 TX2plus), PDC20376, PDC20378 | 2* | 2* | - | - | + | - | PCI/33/66 | ||
Promise PDC20319 (FastTrak S150 TX4) | 2-4* | 2* | 4* | - | + | - | PCI/33/66 | ||
SIS 180 | 2* | 2* | - | - | - | - | PCI/33 | ||
SIS 964 (южный мост SIS 760/755/741/GX/661/655FX/TX), 965L | 2* | 2* | - | - | 300 MB/s | ||||
SIS 965 (южный мост SIS 756/656/649) | 2-4* | 2* | 4* | - | н/д | - | 600 MB/s | ||
Silicon Image Sil3112 | 2* | 2* | - | - | - | - | PCI/33/66 | ||
Silicon Image Sil3512 | 2* | 2* | - | - | - | NCQ* | PCI/33/66 | ||
Silicon Image Sil3114 | 2-4* | 2* | 4* | - | - | NCQ* | PCI/33/66 | ||
Silicon Image Sil3124 | 2-4* | 2* | 4* | 3-4* | н/д | TCQ/NCQ | PCI-X | ||
VIA VT6240, VT6221 | 2* | 2* | - | - | - | - | PCI/33/66 | ||
VIA VT6240, VT6221 + PHY-контроллер (SATA Lite) | 2-4* | 2* | 4* | - | |||||
VIA VT8237 (южный мост VIA 880/800/600/533/400A) | 2* | 2* | - | - | 133 MB/s | ||||
VIA VT8237 + PHY-контроллер (SATA Lite) | 2-4* | 2* | 4* | - | |||||
VIA VT8251 (перспективный южный мост) | 2-4 | 2 | 4 | - | н/д | NCQ | н/д | ||
Легенда | н/д = нет данных |
В колонке Чередование RAID 1 помечены чипы, которые хотя бы в одном тесте работают с массивом RAID 1 быстрее, чем с одиночным диском. Эффективной реализацией RAID 1 и 0+1 обладают чипсеты NVidia: благодаря оптимизации последовательного чтения RAID 0+1 показывает невероятную скорость чтения в Burst Mode - до 320 MB/s по ATTO, а общая производительность RAID 1 и 0+1 в тестах IOMeter аналогична производительности соответствующих по числу дисков массивов RAID 0. В драйверах RAID от Promise оптимизирован только случайный доступ, в то время как последовательное чтение идет на одинарной скорости.
В колонке Внешняя шина для дискретных решений указан интерфейс обмена данными, а для встроенных контроллеров - верхняя граница скорости обмена при максимальном размере дискового массива. Верхняя граница посчитана по формуле: min (s*150, b), где s - число независимых каналов Serial ATA, b - пропускная способность внешней шины. Понятно, что речь идет о теоретической скорости обмена; реальная максимальная скорость обмена определяется по результатам испытаний и бывает на 10-50% ниже.
Значком * помечены позиции, для которых соответствующие функции RAID реализованы программно, т.е. выполняются драйвером, а не контроллером. Значком # помечены позиции, для которых применяется аппаратное ускорение. Отсутствие значка говорит о том, что способ реализации не выяснен.
В качестве примера остановимся более подробно на поддержке RAID в чипсетах Intel. Чтобы включить RAID для южных мостов ICH5R и ICH6R(RW), требуется Intel Application Accelerator - поэтому дисковый массив будет работать только под Windows 2000/XP/2003 (имеется также патч для ядра Linux 2.4 с ограниченными возможностями). Это наводит на мысль о том, что RAID от Intel является программным, т.е. все специфичные операции выполняются на центральном процессоре - насколько можно судить по BIOS, для этого используется технология HostRAID от Adaptec. Программный характер RAID подтверждается изучением спецификаций южных мостов, в которых упомянут только один регистр конфигурации RAID, причем его значение не зависит от типа массива RAID (0 или 1). Надо отметить, что многие производители распаивают на топовых платах с чипсетами Intel сторонние контроллеры Serial ATA RAID вместо того, чтобы полагаться на южный мост - и это несмотря на то, что тот показывает отличную производительность в массивах RAID 0 и 1. Вот статья, в которой производительность RAID на ICH5R сравнивается с производительностью контроллера Promise PDC20319.
Аналогичным образом поддерживается RAID в южном мосте 6300ESB. К примеру, для платы Intel SE7210TP1-E ("Torrey Pines") применяются драйверы HostRAID от Adaptec с теми же ограничениями на операционные системы - поддерживается Windows NT и выше, а для Linux есть патчи, которые надо вшивать в ядро системы.
Обсуждение технологий RAID, а также тесты производительности контроллеров и жестких дисков в массивах RAID можно найти на сайтах www.fcenter.ru, www.thg.ru, www.ixbt.com и www.techreport.com .
Дефицит модулей небуферизованной ECC можно объяснить тем, что совместимые материнские платы для Pentium 4 слишком дороги для массового рынка. Возможно, что с распространением Athlon 64 ситуация выправится, т.к. этот процессор совершенно бесплатно поддерживает небуферизованные модули с ECC в своем встроенном контроллере памяти.
Недорогие серверы почти повсеместно собирают на процессорах Intel:
Для сервера важны не гигагерцы, а гипертрединг и объем кэша. Дешевую и малошумную систему можно собрать на любом процессоре Pentium 4 с ядром Northwood, частотой до 2.8 GHz и штатном боксовом кулере. Процессоры с более высокой частотой работают при увеличенном напряжении питания и тепловыделении, поэтому их боксовый кулер имеет регулируемые обороты и под нагрузкой начинает шуметь. Если требуется малошумная работа во всех режимах, то потребуется более качественный кулер, который охладит процессор на оборотах около 3000 RPM или ниже (статья).
Гипертредингом обладают:
- Все процессоры Pentium 4 c шиной 800 MHz.
- Процессор Pentium 4 c шиной 533 MHz и частотой 3.06 GHz.
- Все процессоры Xeon c шиной 533 MHz и 800 MHz.
Кэш объемом больше 512K имеется на процессорах с ядрами Gallatin, Prescott и Nocona. Процессоры Gallatin мало кто видел вблизи из-за их высокой стоимости (к их числу относятся Pentium 4 Extreme Edition и старшие модели Xeon с частотой от 3 GHz). Демократичную цену имеет Prescott, но его температурный режим оставляет желать лучшего. Nocona - это серверный вариант Prescott с шиной 800 MHz и поддержкой 64-битной арифметики (EM64T, aka AMD64).
Если не гнаться за физической многопроцессорностью и кэшем больше 512K, то оптимальным выбором будет процессор на ядре Northwood с шиной 800 MHz и частотой до 2.8 GHz. Такие процессоры бывают всего трех модификаций: Pentium 4 2.4С, 2.6С и 2.8C. Если системная плата не поддерживает шину 800 MHz, то при известной доработке системы охлаждения подойдет Pentium 4 3.06/533 Mhz.
А теперь немного о процессорах Athlon. При обсуждении ограничимся однопроцессорными вариантами, поскольку именно они наиболее интересны для применения в серверах начального уровня.
Традиционный процессор Athlon XP хорош тем, что при низкой цене он мало в чем уступает процессору Penitum 4 (разве что пиковая скорость обмена данными с памятью в 2-3 раза ниже). Но дешевизна его и подводит - Athlon XP жестко позиционируется для систем low-end, соответственно большинство чипсетов под него не поддерживают память с ECC. Исключение составляют только самые древние чипсеты, как то AMD760 и VIA KT133/266/333. Разработка новых материнских плат под эти чипсеты уже не ведется, а в старых платах отсутствует поддержка Serial ATA RAID. Поэтому дисковый массив надо будет подключать через внешний контроллер PCI или создавать программным путем.
Гораздо интереснее Athlon 64, который работает с небуферизованной памятью DDR через интегрированный контроллер - минуя чипсет. Схему коррекции ошибок Athlon 64 унаследовал от серверного процессора Opteron, т.е. ECC поддерживается для памяти, а также имеется в кэше L2 и кэше данных L1; кэш команд L1 имеет контроль четности. Аналогичной поддержкой ECC обладает бюджетный процессор Sempron 3100+ на ядре Pairs с 32-битной арифметикой и кэшем L2 256K, благодаря чему его тоже можно использовать в качестве серверного :). Таким образом, поддержка памяти ECC в системах на основе линейки AMD K8 имеется независимо от чипсета. Что касается поддержки Serial ATA RAID, то проще назвать чипсеты, где ее нет - это NVidia nForce3 150, SIS 755(963) и Uli 1689/1687 (так теперь называется чипсетное подразделение Ali). Вce остальные чипсеты - NVidia nForce3 Ultra/250Gb/250, VIA K8M800/K8T800 и SIS 760/756/755(964) поддерживают, как минимум, Serial ATA RAID уровней 0 и 1; для поддержки RAID 0+1 требуется распайка на плате дополнительного PHY-контроллера. В дополнение к этому, чипы nForce3 Ultra и 250Gb снабжены гигабитным сетевым интерфейсом с фильтрацией IP-пакетов, а VIA K8M800 и SIS 760 имеют встроенное графическое ядро. В готовящемся к выпуску чипсете ATI на ядре RS480 обещана поддержка Serial ATA RAID 0/1/0+1 и графическое ядро Radeon 9600. Такой интеграции функций нет даже в самых новых чипсетах для Pentium 4.
Продолжая хвалить Athlon 64, упомянем режимы Cool'n'Quiet с пониженной частотой и напряжением питания (см. Процессоры с низким тепловыделением). Как мы уже отмечали, для файлового сервера высокая частота процессора непринципиальна, а вот экономия электроэнергии при круглосуточной работе будет вполне ощутимой. Для защиты от вирусов пригодится поддержка бита NX (Non Execute), который блокирует исполнение программного кода при ошибках переполнения буфера. Поддержка NX есть во Windows XP SP2, ее также планируется включить во Windows Server 2003 SP1. Что же до 64-битной арифметики - то ее наличие, как минимум, не помешает :). Аналогичные возможности недавно появились в процессорах Intel с ядром Prescott степпинга E0 и Nocona.
Все это просто здорово, но важно то, чтобы система в сборе действительно заработала, как обещано - потому что платформе всего один год и многие платы под Athlon 64 пока еще сыроваты. Вот одна из статей, которая позволяет судить о текущем состоянии дел в этой области: Проблемы двух модулей памяти и Socket 754: проверка совместимости.
Среди существенных преимуществ платформы Intel остается гипертрединг, пока не имеющий аналогов в серийных процессорах AMD, а также очень хорошая отработанность процессоров с топологией 0.13m. Благодаря последнему обстоятельству серверная платформа Intel выглядит более предпочтительно. Но как бы не были консервативны серверные технологии, смена платформы произойдет и здесь. В этом плане соперниками AMD K8 будут процессоры Intel с топологией 0.09m, которые уступают своим предшественникам по таким важным параметрам, как тепловыделение и длина конвейера.
Среди чипсетов для серверов и рабочих станций выделяется продукция Intel и Serverworks. Вот основные характеристики чипсетов Intel для одно- и двухпроцессорных плат:
Чипсет | Северный мост | Южный мост и концентраторы PCI 32 / 64bit | |||||||||||
CPU | FSB | HT | 64 | RAM | max | Шины | Южный мост | HDD | LAN | USB | PCI | PCI32 / 64bit PCI Express | |
E7525 | 1 / 2* Xeon | 800 | + | + | 8 * DDR2 / 400 6* DDR / 333 ECC registered | 16G | PCI Express X16, X4 | ICH5 1 | 4 / 2*ATA / 100 2* SATA / 150RAID 0 / 1 | 10 / 100 | 8 * 2.0 | 6* 2.3 | 2 * PCI / 33 / 66 / PCI-X / 66-133(6700PXH) |
E7520 | 1 / 2* Xeon | 800 | + | + | 8 * DDR2 / 400 6* DDR / 333 / 266 ECC registered | 16G | PCI Express 2 X8, X4 | ICH5 1 | 4 / 2* ATA / 100 2* SATA / 150RAID 0 / 1 | 10 / 100 | 8 * 2.0 | 6* 2.3 | 2*PCI / 33 / 66 / PCI-X / 66-133(6700PXH) |
E7320 | 1 / 2* Xeon | 800 | + | + | 8 * DDR2 / 400 6* DDR / 333 / 266 ECC registered | 16G | PCI Express X4 | ICH5 1 | 4 / 2* ATA / 100 2* SATA / 150RAID 0 / 1 | 10 / 100 | 8 * 2.0 | 6* 2.3 | 2*PCI / 33 / 66 / PCI-X / 66-133(6700PXH) |
E7505 | 1 / 2* Xeon | 533 400 | + | - | 6* DDR / 266 / 200 ECC / nonECC registered / unbuffered | 16G | AGP8X | ICH4 | 4* ATA / 100 | 10 / 100 | 6* 2.0 | 6* 2.2 | 6*PCI / 33 / 66 / PCI-X / 66-133(3*P64H2) |
E7501 | 1 / 2* Xeon | 533 400 | + | - | 8* DDR / 266 / 200 ECC registered | 16G | - | ICH3-S | 4* ATA / 100 | 10 / 100 | 6* 1.1 | 6* 2.2 | 6*PCI / 33 / 66 / PCI-X / 66-133(3*P64H2) |
E7500 | 1 / 2* Xeon | 400 | - | - | 8* DDR / 200 ECC registered | 16G | - | ICH3-S | 4* ATA / 100 | 10 / 100 | 6* 1.1 | 6* 2.2 | 6*PCI / 33 / 66 / PCI-X / 66-133(3*P64H2) |
860 | 1 / 2* Xeon | 400 | - | - | 4* RDRAM PC800 ECC / nonECC | 4G | AGP 4X | ICH2 | 4* ATA / 100 | 10 / 100 | 4* 1.1 | 6* 2.2 | PCI2*33 / 4*66(P64H) |
925X | Pentium4 LGA775 | 800 | + | - | 4* DDR2 / 533 / 400 ECC / nonECC unbuffered | 4G | PCI Express X16 | ICH6R | 2*ATA / 100 4* SATA / 150RAID 0 / 1 | 10 / 100 | 8* 2.0 | 4* 2.3 | PCI Express 4X1 |
E7210 | Pentium4 mPGA478
1 / 2* Xeon |
800 533
533 |
+ | - | 4* DDR / 400 / 333 / 266 ECC / nonECC unbuffered | 4G | CSA | 6300 ESB | 2*ATA / 100 2* SATA / 150RAID 0 / 1 | - | 4* 2.0 | 4* 2.2 | 2 * PCI / 33 / 66 / PCI-X / 66+2 PCI-X оnbrd |
875P | Pentium4 mPGA478
1 / 2* Xeon |
800 533
533 |
+ | - | 4* DDR / 400 / 333 / 266 ECC / nonECC unbuffered | 4G | AGP 8X CSA | ICH5R | 4*ATA / 100 2* SATA / 150RAID 0 / 1 | 10 / 100 | 8* 2.0 | 6* 2.3 | - |
E7205 | Pentium4 mPGA478 | 533 400 | + | - | 4* DDR / 266 / 200 ECC / nonECC unbuffered | 4G | AGP 8X | ICH4 | 4* ATA / 100 | 10 / 100 | 6* 2.0 | 6* 2.2 | - |
850E | Pentium4 mPGA478 | 533 400 | + | - | 4* RDRAM PC1066 / 800 ECC / nonECC | 4G | AGP 4X | ICH2 | 4* ATA / 100 | 10 / 100 | 4* 1.1 | 6* 2.2 | - |
1 Вместо южного моста ICH5R может применяться южный мост 6300ESB |
Чипсеты для Xeon поддерживают скоростную шину PCI для подключения высокопроизводительных внешних контроллеров. В частности, все чипсеты поддерживают 32 и 64-битные платы PCI, работающие на частоте 33 или 66 MHz с пропускной способностью 133, 266 или 533 MB/s. Шина PCI-X позволяет поднять частоту до 133 MHz и получить пропускную способность 1066 MB/s. Возможности данных чипсетов подробно освещаются в статьях: Серверы на основе процессоров Intel... и Двухпроцессорная система на Xeon: выгодная альтернатива Intel Pentium 4 EE.
В отличие от двухпроцессорных, однопроцессорные чипсеты поддерживают только стандартные платы PCI (32 bit, 33 MHz, 133 MB/s). Слабость южного моста у чипсета 875P отчасти компенсируется возможностью подключения гигабитного сетевого интерфейса к северному мосту (CSA - Communication Streaming Architecure). В более новых чипсетах E7210 и 925X имеется поддержка шин с пропускной способностью до 533 MB/s.
Чипсет 925X выделяется еще и тем, что в варианте с южным мостом ICH6R(RW) и драйвером Intel Application Accelerator у него есть поддержка RAID 0/1/MST и NCQ. Для полного улета не хватает только RAID 0+1! По этому чипсету, который в настоящее время проходит обкатку на покупателях, можно судить о том, какое будущее готовит нам Intel. В существующие платы на этом чипсете не получится поставить процессор с ядром Northwood, т.к. в корпусе LGA775 выпускаются только процессоры с ядрами Gallatin и Prescott. От памяти DDR тоже придется отказаться в пользу DDR2, которая пока работает медленнее из-за своей большой латентности. Про видеокарты для AGP тоже можно забыть - на смену этой шине пришла PCI Express. Впрочем, при желании можно поставить антикварную карточку для PCI ;).
В нашем случае скоростная шина не потребуется, т.к. будет применяться встроенный контроллер Serial ATA RAID. Поэтому нам хватит возможностей чипсета 875P.
На момент сборки сервера Intel Application Accelerator не поддерживал Windows Server 2003, поэтому была выбрана плата ASUS P4C800 Deluxe на чипсете 875P с дискретным контроллером Serial ATA RAID Promise PDC20378. Этот контроллер функционально аналогичен плате FastTrak S150 TX2plus, т.е. он реализует программный RAID, но при этом обладает широкой поддержкой различных операционных систем. Контроллер обеспечивает работу 2 дисков Serial ATA и 2 дисков Parallel ATA в режимах RAID 0, 1 и 0+1. Плата P4C800 Deluxe имеет встроенный гигабитный сетевой адаптер 3COM 3С940. Оба устройства (контроллер RAID и сетевой адаптер) сидят на шине PCI. Для меня это приемлемо, т.к. сервер подключается к 100-мегабитной сети и сетевой адаптер даже в дуплексе возьмет не более 20% от пропускной способности шины (25 MB/s от 133 MB/s). В случае гигабитной сети подойдет более новая плата P4C800-E Deluxe, на которой распаян контроллер Intel 82547EI с интерфейсом CSA.
Среди хороших свойств плат серии P4C800 можно указать встроенный звук, режим Q-Fan для регулировки оборотов кулера из BIOS и функции разгона, которые позволяют провести стресс-тест сервера. Такое применение разгона признает даже Intel, которая разрешила разгон в плате D875PBZ ("Bonanza") - правда, всего на 4% ;).
Отмеченные мной недостатки платы состояли в отсутствии вентилятора на северном мосте чипсета, а также в недостоверности показаний некоторых датчиков. Напряжения +12V и +5V показываются с погрешностью -2% (этот завал может быть вызван плохой разводкой питания). Показания +3.3V скачут, хотя на самом деле напряжение стабильно. А датчик фана как-то раз показал 18000 оборотов :).
3.8. Комплектация сервера и его разгон
Сборка | This | Arbyte Alkazar S100 |
CASE | 3R R101 | Yeong Yang YY-W201 Pedestal Server Chassis |
PSU | RPS 300 | FSP400-60PN |
MB | ASUS P4C800 Deluxe | Intel S875WP1 |
CPU | Pentium 4 2.4C/800/512 | Pentium 4 3.0C/800/512 |
RAM | 4*256 Hynix PC 3200 | 2*512 Kingston ValueRAM PC3200 ECC |
HDD | Seagate ATA 120G 31200026A | - |
Seagate Serial ATA 120G 31200026AS (2*RAID 1) | Seagate Serial ATA 80G ST380013AS (2*RAID 1) | |
CDD | DVD/CDRW LG CGC-4480B | NEC CD-ROM CD-3002A |
GPU | Radeon 9200SE | ATI Rage XL (onboard) |
OS | Windows Server 2003 Standard Edition | Windows Server 2003 Standard Edition |
Цена | 32000 (w/o OS) | 40000 (w/o OS) |
Тест | Pentium 2.4@2.88/800 (1.60V) | ||
+12V | +5V | +3.33V | |
Idle | 11.98V | 5.12V | 3.34V |
Prime95 | 11.80V | 5.15V | 3.34V |
Prime95 + BurnP6 | 11.76V | 5.17V | 3.34V |
S&M 0.32 alpha | 11.74V | 5.18V | 3.34V |
Дальнейшие эксперименты (уже не для тестирования, а ради любопытства) проводились с более мощным блоком питания FSP350-60PN. Чтобы погнать плату до предела, на нее был поставлен процессор Prescott 2.8 под кулером ASUS Neptune AH7. Prescott погнался до 3.5 GHz (FSB 250). На этой частоте система загружалась, хотя работала неустойчиво. По спецификации, на плату P4C800 Deluxe можно ставить процессоры с частотой до 3.2 GHz.
Тест Prime95 дает верхнюю оценку температуры процессора при работе в реальных приложениях. Экстремальный прогрев проводится двумя программами, т.к. процессор имеет гипертрединг. По моим замерам, комбинация Prime95 + BurnP6 греет процессор c гипертредингом на 1-2 градуса сильнее, чем BurnP6 + BurnMMX.
Режим | MB Temp | CPU Temp (2.4GHz) | HDD Temp | |||
Idle | Prime95 | P95+BP6 | Idle | Copying | ||
Speed 0 | 36 | 41 | 59 | 60 | 45 | 48 |
Speed 1 | 34 | 40 | 57 | 59 | 42 | 45 |
Speed 2 | 32 | 41 | 58 | 60 | 38 | 40 |
Speed 3 | 30 | 40 | 57 | 60 | 35 | 37 |
Speed 4 | 28 | 39 | 56 | 59 | 32 | 34 |
Speed 5 | 28 | 38 | 56 | 60 | 31 | 33 |
Разброс | 8 | 3 | 3 | 1 | 14 | 15 |
Из результатов видно, что корпусные вентиляторы слабо влияют на температуру процессора, но зато хорошо охлаждают диски. Я думаю, что этот разнобой связан с особенностями воздушных потоков: если корпусные вентиляторы остановлены, то воздух частично идет по короткому пути через решетку вытяжного вентилятора (см. рис. ниже). При такой вентиляции процессор охлаждается хорошо, чего не скажешь об остальных компонентах системы. Нормальный поток воздуха имеет место только при работающих корпусных вентиляторах.


Особая благодарность специалистам фирмы Sunrise-Екатеринбург за сборку сервера.
24 сентября 2004 года - публикация. |
5 октября 2004 года - дополнения в таблице чипсетов для E7505, E7210, 875P. |
Рауль Нурович Шакиров |
http://www.imach.uran.ru/rns |
Самый "свежий" вариант статьи можно найти на сайте автора.
Ждём Ваших комментариев в специально созданной ветке конференции.
Лента материалов раздела
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Сейчас обсуждают