Шоу монстров от AMD: двухъядерные CPU в двухпроцессорной рабочей станции
реклама
2005 год ознаменовался появлением на рынке двухъядерных процессоров. Оба основных разработчика CPU, компании AMD и Intel, представили свои варианты двухъядерных архитектур, которые нашли применение как в серверных процессорах, так и в CPU для настольных компьютеров. Новые архитектуры вызвали огромный интерес со стороны пользователей, ведь именно по пути увеличения числа ядер в одном CPU будет, по всей видимости, двигаться дальнейший прогресс в этой отрасли.
Естественно, мы уже уделили должное внимание двухъядерным архитектурам. Так, на нашем сайте присутствует обзор, в котором сравниваются процессоры AMD и Intel с двумя ядрами: Pentium D и Athlon 64 X2. И казалось бы, что до выхода новых моделей двухъядерных процессоров тема уже исчерпана. Но, тем не менее, нам удалось найти ещё один повод для того, чтобы поговорить о многоядерных архитектурах CPU снова. А именно, мы решили посмотреть, как будут вести себя двухъядерные процессоры, будучи объединёнными в двухпроцессорную систему. То есть, другими словами, мы решили провести "разведку боем" и выяснить, на что будет способна сегодня четырёхъядерная система.
Во время тестирования двухъядерных CPU мы неоднократно сталкивались с тем, что современное программное обеспечение не всегда способно эффективно использовать многопоточность, в результате чего увеличение количества исполнительных ядер в процессоре не приводит к росту производительности. Очевидно, что ситуация с программным обеспечением, способным нагрузить работой сразу четыре ядра, будет ещё хуже. Несмотря на то, что компания Intel уже очень давно начала продвигать на рынок идею "виртуальной" двухъядерности, технологию Hyper-Threading, далеко не все разработчики программ предусматривают в своих продуктах возможность создания даже двух параллельных вычислительных потоков. Четыре же параллельных вычислительных потока в программе, очевидно, окажутся ещё более редким явлением.
Тем не менее, собрать двухпроцессорную систему с двухъядерными процессорами без всяких проблем можно уже сегодня. В то время как Intel на данный момент предлагает двухъядерные CPU лишь для настольного сегмента, планируя внедрить такую архитектуру в семействе Xeon лишь в самом конце текущего года, двухъядерные CPU для серверов и рабочих станций уже есть среди предложений компании AMD. Процессоры AMD Opteron с двумя ядрами доступны в семействах 1XX, 2XX и 8XX. Это означает, что в арсенале AMD имеются двухъядерные CPU для серверов и рабочих станций, предназначенные дли использования в однопроцессорных, двухпроцессорных и многопроцессорных системах.
Для проведения испытаний четырёхъядерной платформы мы решили собрать двухпроцессорную систему, укомплектованную парой двухъядерных процессоров семейства Opteron 2XX. Очевидно, что двухпроцессорная система, которую можно адекватно сравнивать с настольными компьютерами верхней ценовой категории должна представлять собой рабочую станцию, а не сервер. К счастью, в последнее время на рынке появилось некоторое количество богатых возможностями двухпроцессорных материнских плат, способных послужить основой рабочей станции на базе процессоров Opteron. Произошло это во многом благодаря появлению новых чипсетов профессионального уровня для процессоров семейства K8, в первую очередь NVIDIA nForce Professional. Ведущие производители материнских плат уровня high-end в настоящее время предлагают большое количество двухпроцессорных продуктов на базе этого набора логики с поддержкой шины PCI Express. Именно такую плату и имеет смысл использовать в качестве основы рабочей станции.
Очевидно, что в приложениях, не использующих многопоточность, тестировать двухпроцессорную систему с двухъядерными процессорами смысла не имеет. Поэтому, в рамках этой статьи мы в первую очередь будем уделять внимание тем приложениям, которые поддерживают многопоточность и являются типичными для использования на рабочих станциях. По этой причине в этом материале вы не найдёте тестов в игровых программах, которые не получают выигрыша даже на обычных системах с двухъядерными процессорами. Зато мы уделим повышенное внимание программам для кодирования и обработки видео, системам автоматизированного проектирования и программным средствам для 3D моделирования и рендеринга. Именно поэтому при тестировании мы решили прибегнуть и к услугам профессиональной видеокарты, специально предназначенной для использования в приложениях такого типа.
реклама
Таким образом, данной статьёй будет решено сразу несколько задач. Во-первых, мы посмотрим, на что способны современные рабочие станции, построенные на процессорах AMD Opteron. Во-вторых, мы сможем дать оценку перспективности четырёхъядерных систем с точки зрения получаемого от добавления двух дополнительных ядер прироста в быстродействии в наиболее сложных программных пакетах. И в-третьих, мы уделим внимание сравнению производительности мощных рабочих станций и топовых настольных систем верхнего ценового диапазона, что позволит нам сделать вывод об эффективности финансовых вложений именно в рабочие станции.
Цели определены, так что переходим к делу.
Строим рабочую станцию
В этом разделе мы последовательно рассмотрим особенности тех комплектующих, которые были применены нами для сборки рабочей станции, основанной на двух двухъядерных процессорах семейства AMD Opteron.
Материнская плата
В качестве основы двухпроцессорной платформы нами была выбрана материнская плата ASUS K8N-DL. Основываясь на наборе системной логики NVIDIA nForce Professional, помимо поддержки двух Socket 940 процессоров данный продукт поддерживает и графическую шину PCI Express x16, что делает его идеальным решением для высокопроизводительной рабочей станции. При этом ASUS K8N-DL не отличается излишними "наворотами", ценность которых в нашем случае весьма сомнительна, и это делает её совсем неплохим решением с точки зрения ценового фактора. Кроме того, данная материнская плата обладает и некоторыми возможностями для разгона, что для продуктов данной категории – очень большая редкость.
реклама
Формальные характеристики этого продукта звучат следующим образом:
ASUS K8N-DL | |
Процессоры | Dual AMD Opteron для Socket 940 |
Чипсет | NVIDIA nForce Professional |
Шина HyperTransport | 1 GHz |
Частоты тактового генератора, МГц | 200-400 (с шагом 1 МГц) |
Функции для разгона | Независимое тактование шины PCI Express |
Возможность изменения напряжений на процессорах, чипсете, памяти и шине HyperTransport | |
Память | 6 слотов DDR DIMM для двухканальной регистровой DDR SDRAM |
Слоты PCI Express | 1 x PCI Express x16 |
1 x PCI Express x1 | |
Слоты расширения PCI | 2 |
Порты USB 2.0 | 10 (4 – на задней панели) |
Порты IEEE1394 | 2 (1 – на задней панели, через контроллер Texas Instruments TSB43AB22A) |
ATA-100/133 | 2 канала ATA-133 (через чипсет) |
Serial ATA | 4 канала Serial ATA-150 (с поддержкой RAID, через чипсет) |
4 канала Serial ATA-150 (с поддержкой RAID, через контроллер Silicon Image Sil3114R) | |
Поддержка ATA RAID | RAID 0, 1, 0+1 у чипсета |
RAID 0, 1, 0+1, 5 у контроллера Silicon Image Sil3114R | |
Интегрированный звук | Восьмиканальный AC97 кодек Realtek ALC850 |
Интегрированная сеть | Gigabit Ethernet (через контроллер BROADCOM BMC5751) |
Дополнительные возможности | Нет |
BIOS | Award BIOS v6.00PG |
Форм-фактор | ATX, 305x267 мм |
Прежде чем более подробно рассказать о характеристиках и особенностях ASUS K8N-DL, несколько слов необходимо сказать о чипсете NVIDIA nForce Professional, поскольку ранее мы с ним не сталкивались. Впрочем, сразу отметим, что ничего принципиально нового в нём нет, этот профессиональный чипсет построен из тех же базовых компонентов-кубиков, что и nForce4 Ultra. Дело в том, что для поддержки многопроцессорности архитектура K8 не требует от набора логики никаких специальных средств. Процессоры семейства Opteron оснащаются тремя независимыми шинами HyperTransport, которые с одинаковым успехом могут быть использованы как для соединения процессоров с микросхемами чипсета, так и для соединения процессоров между собой. Поэтому, сами микросхемы набора логики не нуждаются в добавлении дополнительных процессорных шин.
Более того, такая архитектура двухпроцессорной системы позволяет использовать в составе набора логики две микросхемы, которые напрямую не связаны между собой. Взаимодействие между этими микросхемами может происходить через процессоры, посредством той же шины HyperTransport.
Именно этой возможностью при разработке nForce Professional и воспользовались инженеры NVIDIA. Этот чипсет включает в себя две микросхемы: аналогичный nForce4 Ultra MCP (media and communication processor) чип nForce Professional 2200 и примерно такой же чип с несколько урезанными возможностями, nForce Professional 2050. Эти чипы могут использоваться как по отдельности, так и вместе. Их сочетание обуславливает конкретные возможности материнской платы. Чтобы чётче определить спецификации MCP nForce Professional 2200 и nForce Professional 2050, приведём таблицу, где они будут сопоставлены с характеристиками MCP nForce4 SLI/Ultra:
nForce4 SLI/Ultra | nForce Professional 2200 | nForce Professional 2050 | |
Процессорная шина | 1 ГГц HyperTransport | 1 ГГц HyperTransport | 1 ГГц HyperTransport |
Шины PCI Express | 20 произвольно конфигурируемых линий | 20 произвольно конфигурируемых линий | 1 x PCI Express x16 |
3 x PCI Express x1 | |||
Поддержка SLI | Есть | Есть | Нет |
USB 2.0 | 10 портов | 10 портов | Нет |
Serial ATA | 3 Гбит/сек | 3 Гбит/сек | 3 Гбит/сек |
Число портов Serial ATA | 4 | 4 | 4 |
Число каналов Parallel ATA | 2 | 2 | 0 |
Поддержка RAID | 0, 1, 0+1 | 0, 1, 0+1 | 0, 1, 0+1 |
Gigabit Ethernet | Есть | Есть | Есть |
Secure Networking Engine | Есть | Есть | Есть |
NVIDIA Firewall 2.0 | Есть | Есть | Есть |
Шина PCI (32 бит) | Есть | Есть | Нет |
Интегрированный звук | 8-канальный AC97 | 8-канальный AC97 | Нет |
Как видим, nForce Professional 2200 представляет собой полный аналог nForce4 SLI/Ultra, а nForce Professional 2050, обладающий сильно урезанными возможностями, может выступать, пожалуй, лишь в роли чипа-компаньона.
Отсюда следуют типовые конфигурации систем, построенных на базе nForce Professional. Двухпроцессорная рабочая станция, использующая в своей основе чип nForce Professional 2200, может похвастать тем же функционалом, что и любая материнская плата на nForce4 Ultra для энтузиастов. Поддержка же двухпроцессорных конфигураций в данном случае реализуется благодаря свойствам процессоров Opteron, которые, в отличие от Athlon 64, обладают не одной, а тремя шинами HyperTransport.
Если же производитель материнской платы захочет расширить функциональность своего продукта, то в пару к nForce Professional 2200 он может добавить второй чип nForce Professional 2050. В этом случае число поддерживаемых портов Serial ATA возрастёт до восьми, а число интегрированных гигабитных Ethernet контроллеров – до двух. Однако самое интересное приобретение в такой системе – это возможность реализации на плате двух полноценных шин PCI Express x16. Это свойство может быть использовано для создания SLI-конфигураций, поддерживаемых, к слову, и профессиональными видеоускорителями от NVIDIA модельной линейки Quadro FX. Причём, в данном случае режим SLI будет потенциально более производительным, чем в системах на чипсете nForce4 SLI, где для установки парных видеокарт используется урезанная шина PCI Express x8.
Хотя об архитектуре систем на базе NVIDIA nForce Professional мы говорили применительно к двухпроцессорным системам, никто не мешает применять подобные принципы и при создании одно- или четырёхпроцессорных систем. NVIDIA nForce Professional – решение в этом плане универсальное.
Материнская плата ASUS K8N-DL использует чипсет nForce Professional в наиболее простом варианте. Соответственно, MCP на плате лишь один, и это – nForce Professional 2200. Следует отметить, что диагностические утилиты отождествляют MCP NVIDIA nForce Professional 2200 и NVIDIA nForce4. Не явный ли это аргумент в пользу идентичности этих чипсетов?
реклама
Именно этот "универсальный" чип и обуславливает большинство возможностей ASUS K8N-DL. Так, через эту микросхему на плате реализованы слот PCI Express x16, слот PCI Express x1, два 32-битных слота PCI, четыре из восьми Serial ATA-II портов, Parallel ATA порты, десять USB 2.0 портов и интегрированный звук, в аналоговой части которого применён восьмиканальный кодек Realtek ALC850.
Есть на плате и несколько дополнительных контроллеров. Например, по каким-то причинам инженеры ASUS отказались от задействования интегрированного в nForce Professional 2200 сетевого контроллера. Вместо этого на плате имеется PCI Express x1 гигабитный сетевой контроллер BROADCOM BMC5751. Кроме того, ASUS K8N-DL оборудована дополнительным Serial ATA RAID контроллером Silicon Image Sil3114R, посредством которого реализуется четыре дополнительных Serial ATA-I порта с поддержкой RAID уровней 0, 1, 0+1 и 5. Также, на рассматриваемой плате есть два IEEE1394 порта, за функционирование которых отвечает микросхема Texas Instruments TSB43AB22A.
Впрочем, наибольшего внимания заслуживают возможности ASUS K8N-DL в части поддержки процессоров и памяти. На них остановимся несколько подробнее. Так, на рассматриваемой плате имеется два процессорных гнезда Socket 940, которые позволяют использование одного или двух процессоров семейства Opteron. Последний (на момент тестирования) BIOS для этой платы, имеющий номер версии 1004 даёт возможность использовать в этой плате как обычные Opteron, так и двухъядерные.
Рядом с обоими процессорными гнёздами на плате размещаются слоты памяти: четыре слота рядом с одним Socket 940 и два слота – рядом с другим. Поскольку в CPU семейства Opteron контроллер памяти интегрирован в процессорное ядро, каждый из двух процессоров двухпроцессорной системы может работать с собственной памятью. Однако, благодаря технологии NUMA (Non-Uniform Memory Architecture) процессоры в этом случае оперируют единым адресным пространством. То есть, каждый из процессоров может обращаться к памяти, подключенной к другому CPU через шину HyperTransport, соединяющую процессоры. Причём для этого не требуется никаких специальных ухищрений. Более того, для каждого из процессоров совершенно всё равно, в какой памяти находятся запрашиваемые данные. Впрочем, при этом следует иметь в виду, что если эти данные окажутся в памяти, подключенной к соседнему процессору, латентность соответствующей операции окажется несколько больше, чем в случае обращения к собственной памяти.
Контроллеры памяти процессоров Opteron работают исключительно с регистровыми модулями DDR SDRAM. Благодаря этому достигается возможность поддержки больших объёмов памяти. Так, ASUS K8N-DL с её шести слотами DIMM поддерживает до 24 Гбайт памяти (при условии использования 4-гигабайтных регистровых модулей, которые вот-вот должны появиться на рынке).
Так же, как и в Socket 939 системах, контроллер памяти Opteron имеет двухканальную архитектуру. Поэтому, для достижения наибольшей производительности, модули памяти следует ставить в систему парами. При использовании двухпроцессорных конфигураций эффективнее будет распределить память между процессорами, установив в систему четыре одинаковых модуля. Это позволит в теории достичь пропускной способности памяти, характерной для четырёхканальной подсистемы памяти.
Ознакомившись с основными свойствами ASUS K8N-DL, давайте взглянем на её дизайн.
Честно говоря, особо положительных эмоций он не вызывает. С другой стороны, требовать от материнской платы для двухпроцессорной рабочей станции особого удобства при сборке, видимо, не следует. Во-первых, такая плата гораздо сильнее загружена компонентами, чем привычные нам платы для энтузиастов, а во-вторых, системы уровня рабочих станций не подвергаются частой модернизации, как это бывает в системах продвинутых пользователей.
Материнская плата ASUS K8N-DL имеет несколько больший размер PCB, чем обычные ATX материнские платы. Впрочем, при этом она меньше большинства двухпроцессорных плат и вполне нормально должна помещаться в корпусах, поддерживающих Extended ATX.
При проектировании PCB материнской платы ASUS K8N-DL инженеры стремились максимально перенести все разъёмы сверху от процессорных сокетов вниз к слотам расширения. В результате этого стремления наверху в одиночестве остались лишь 24-контактный и 8-контактный разъёмы ATX питания, расположение которых, к слову, достаточно удобно, а также FDD коннектор. Сносным можно признать расположение и чипсетных Serial ATA разъёмов, которые вместе с одним из Parallel ATA коннектором выдвинуты на передний край платы перед слотами расширения. Чтобы не возникло проблем с мешающимися кабелями, часть этих разъёмов инженеры ASUS даже развернули параллельно плате.
Расположение же остальных коннекторов на плате вызывает только недоумение. Среди наиболее существенных недостатков следует назвать помещение второго Parallel ATA порта в самом низу, а также установка коннекторов для передней панели корпуса в дальнем левом углу материнской платы.
При сборке системы на базе ASUS K8N-DL мы также столкнулись и с другими проблемами. В частности, установленная в слот PCI Express x16 видеокарта с массивной системой охлаждения блокирует один из двух слотов PCI. Кроме того, из-за расположения чипсетного кулера вплотную к защёлке графического разъёма, после установки видеокарты извлечь её из слота оказывается очень непросто. Некоторые проблемы возможны и при подключении процессорного кулера первого CPU. Соответствующий коннектор "зажат" между слотами DIMM и процессорным гнездом, из-за чего доступ к нему несколько затруднён.
Забавным фактом, относящимся к дизайну ASUS K8N-DL, следует признать и то, что эта плата заставляет вспомнить те времена, когда конфигурирование системы выполнялось посредством перемычек-джамперов. Все набортные контроллеры, имеющиеся на рассматриваемой плате, отключаются исключительно посредством таких перемычек, а не через BIOS Setup. Этот момент также не следует упускать из виду, ибо после установки платы в корпус вместе с процессорами и картами расширения добраться до джамперов будет весьма проблематично.
Что же касается BIOS Setup ASUS K8N-DL, то по своему внешнему виду он очень похож на BIOS Setup других материнских плат ASUS, несмотря на некоторые отличия в части возможностей. Среди таких отличий следует отметить опции для конфигурирования подсистемы памяти.
Тут среди привычных установок частоты и задержек интегрированного в процессоры контроллера памяти присутствует достаточно большое число функций, направленных на управление ECC.
В остальном, в BIOS Setup ASUS K8N-DL присутствуют вполне привычные настройки.
Аппаратный мониторинг, реализованный на ASUS K8N-DL, особыми изысками не отличается. Единственная особенность: контроль температур и вращений кулеров для каждого из CPU по отдельности. Поддерживается платой и технология Q-Fan, позволяющая управлять скоростью вращения процессорных вентиляторов в зависимости от температуры CPU.
Есть в BIOS Setup и опции, направленные на разгон. Во-первых, плата позволяет изменять частоту тактового генератора в пределах от штатных 200 МГц до 400 МГц с шагом в 1 МГц.
Также, предоставляются развёрнутые функции для изменения на плате всевозможных напряжений.
Напряжение на памяти может быть повышено до 2.9 В (с шагом 0.1 В), напряжение на чипсете со штатных 1.5 В поднимается с шагом 0.1 В до 1.8 В, напряжение HyperTransport также может быть поднято с номинального значения 1.2 В до 1.35 В (с шагом 0.05 В). Что же касается напряжений питания процессоров, то тут возможности весьма ограничены. BIOS Setup лишь предлагает выбор между штатным значением напряжения и напряжением, увеличенным на 50 мВ свыше номинала.
Впрочем, наличие хоть каких-то функций для разгона на материнской плате для двухпроцессорной рабочей станции – уже большое достижение. К тому же в полной мере воспользоваться перечисленными опциями на практике мы так и не смогли. Дело в том, что в нашей лаборатории мы располагали лишь старшими моделями двухъядерных процессоров Opteron с частотой 2.2 ГГц. Поскольку ASUS K8N-DL не позволяет понижать коэффициент умножения CPU, разгон в нашем случае ограничивался потенциалом процессора. Максимум, чего мы смогли добиться без потери стабильности системы, это увеличения частоты тактового генератора до 212 МГц. Частота процессоров в таком состоянии была поднята до 2.33 ГГц. Однако даже такой весьма скромный результат позволяет утверждать, что разгон на ASUS K8N-DL возможен. Так что данная материнская плата может стать весьма привлекательной платформой, если её использовать с процессорами AMD Opteron младших моделей, у которых достаточно низкие штатные тактовые частоты.
Процессоры
Для использования в составе двухпроцессорных систем компания AMD предлагает процессоры семейства Opteron 2XX. Среди этих процессоров на настоящий момент есть и три двухъядерные модели: Opteron 265 с частотой 1.8 ГГц, Opteron 270 с частотой 2.0 ГГц и Opteron 275, работающий на частоте 2.2 ГГц. Пару именно таких процессоров мы и попытались получить для нашего тестирования.
К счастью, наши старания оказались не напрасны. Нам удалось раздобыть пару двухъядерных AMD Opteron с частотой 2.2 ГГц. Однако ими оказались не Opteron 275, как того логично было ожидать, а процессоры более "тяжёлой" серии Opteron 875. Впрочем, для наших экспериментов совершенно всё равно – Opteron 275 или Opteron 875, поскольку отличие между ними заключается лишь в возможности использования последних в многопроцессорных конфигурациях. В составе двухпроцессорной же системы эти CPU работают совершенно одинаково.
Как можно увидеть на фотографии, полученные нами процессоры Opteron имели OPN OSA875FKA6BS. К сожалению, на сайте AMD нет подробных спецификаций именно этой модели, однако расшифровка маркировки даёт нам следующую информацию о них:
Dual-Core AMD Opteron Processor Details | |
CPU ID | Dual-Core AMD Opteron Processor Model 875 |
Model | 875 |
Ordering Parts Number (OPN) | OSA875FKA6BS |
Stepping | E1 |
Frequency | 2.2GHz |
HyperTransport Technology Speed | 1000MHz |
Integrated Memory Controller | 2.2GHz |
Core Voltage | 1.35V |
Case Temperature | 71° C |
Wattage | 95.0W |
L2 Cache Size | 2 x 1 MB |
L2 Cache Speed | 2.2GHz |
Manf. Technology | .09 micron SOI |
Socket | Socket 940 |
Amperage | 66.1 A |
Warranty | 1 year |
Этот CPU имеет максимальную для двухъядерных Opteron частоту в 2.2 ГГц. Таким образом, те процессоры, которые будут тестироваться в рамках этого обзора, являются самыми быстрыми в своём классе. При этом хочется заметить, что двухъядерные процессоры семейства Athlon 64 X2, ориентированные на применение в настольных системах, смогли на сегодняшний день покорить более высокие тактовые частоты. Например, Athlon 64 X2 4800+ и Athlon 64 X2 4600+ работают при частоте 2.4 ГГц. Очевидно, что отсутствие у AMD намерения выводить на рынок аналогичные процессоры семейства Opteron связано с желанием удержать эти CPU для серверов и рабочих станций в рамках принятого теплового пакета в 95 Вт. Типичное тепловыделение же 2.4-гигагерцовых двухъядерных процессоров AMD составляет 110 Вт. На эту величину платформы для серверов и рабочих станций не рассчитаны.
Диагностическая утилита CPU-Z об Opteron 875 выдаёт следующую информацию:
Утилита совершенно верно распознаёт все характеристики, включая наличие L2 кеш-памяти объёмом 1 Мбайт на каждое ядро процессора. Ревизия ядра этого Opteron, как мы видим, – E1. То есть, данный CPU относится к семейству процессоров с ядром степпинга E и поддерживает набор инструкций SSE3.
В целом, по своей архитектуре двухъядерные Opteron аналогичны двухъядерным Athlon 64 X2. Отличие состоит лишь в контроллере памяти и в количестве шин HyperTransport.
Opteron, хотя и имеют двухканальный контроллер памяти, работают исключительно с регистровыми модулями DDR DIMM. Благодаря этому процессоры Opteron могут поддерживать большие объёмы памяти, нежели их собратья из настольных компьютеров. Но за это приходится платить скоростью: регистровые модули несколько более медленны и имеют менее агрессивные задержки.
Память
Таким образом, нам потребовались регистровые модули DDR SDRAM. В настоящее время на рынке есть большой выбор различных регистровых DDR400 модулей разного объёма. Для наших тестов мы выбрали комплекты модулей HyperX от Kingston.
Такие комплекты, характеризующиеся артикулом KRX3200AK2/1G, представляют собой пары регистровых 184-контактных DDR400 DIMM модулей, поддерживающих ECC. Объём пары составляет 1 Гбайт, то есть модули, входящие в комплект – 512-мегабайтные. Штатная частота для этих модулей – 400 МГц, при напряжении питания 2.6 В они способны на работу с таймингами 2.5-3-3-6. По крайней мере, так обещает спецификация. SPD модулей содержит немного иную информацию: там записаны более лояльные тайминги 3-3-3-8:
В процессе практических испытаний мы смогли подтвердить стабильное функционирование модулей Kingston HyperX KRX3200AK2/1G при таймингах 2.5-3-3-6. Поэтому, испытания рабочей станции на базе двух процессоров Opteron проводились именно с такими задержками.
Следует заметить, что в то время как для обычной нерегистровой DDR400 SDRAM задержки 2.5-3-3-6 выглядели бы чересчур плохо, для регистровой DDR400 они на сегодняшний день типичны. Найти в продаже регистровую память c более агрессивными таймингами весьма проблематично. Поэтому, укорять нас в неправильном выборе модулей для тестирования не следует.
При испытании рабочей станции мы устанавливали в неё два комплекта памяти Kingston HyperX KRX3200AK2/1G, то есть четыре модуля по 512 Мбайт. Таким образом, общий объём памяти в испытываемой системе доводился до величины в 2 Гбайта.
Память в системе распределялась между процессорами: два модуля инсталлировались в слоты DIMM, относящиеся к первому CPU и два – в слоты DIMM второго CPU. Благодаря такому распределению модулей памяти мы задействовали технологию NUMA в её симметричном варианте. То есть, рабочая станция имела четыре независимых канала DDR400 SDRAM, что позволило нам достичь теоретической пиковой пропускной способности подсистемы памяти в 12.8 Гбайт в секунду.
Видеокарта
Очевидно, что для хорошей рабочей станции необходима и хорошая видеокарта. Собирая двухпроцессорную платформу, применять которую планируется в системах автоматизированного проектирования и 3D моделирования, устанавливать в неё обычную 3D видеокарту, предназначенную для игр, было бы идеологически неверно. Ведь как раз для приложений этого класса ведущие производители 3D акселераторов предлагают специализированные профессиональные графические карты.
Обратившись к главным производителям таких карт, нам удалось раздобыть видеоплату, основанную на самом современном профессиональном графическом чипе от NVIDIA, Quadro FX 4500, использующем архитектуру G70. Именно эту графическую плату мы и применяли в нашей двухпроцессорной рабочей станции.
Поскольку графический процессор NVIDIA Quadro FX 4500 использует ту же архитектуру, что и NVIDIA GeForce 7800 GTX, характеристики этих продуктов весьма похожи. Однако профессиональные карты имеют слегка более высокую производительность за счёт увеличенной частоты ядра. Так, основная часть ядра Quadro FX 4500 функционирует на частоте 550 МГц, в то время как у GeForce 7800 GTX эта частота составляет 430 МГц. Частота же блока вершинных процессоров у обеих карт совершенно одинакова и составляет 470 МГц.
Память на профессиональной и игровой карте имеет также различные частоты. Так, на игровой карте применяется GDDR3 память с частотой 1200 МГц, а на Quadro FX 4500 частота памяти уменьшена до 1050 МГц. И там, и там память общается с графическим процессором по 256-битной шине, однако, на современных картах GeForce 7800 GTX устанавливается 256 Мбайт памяти, в то время как Quadro FX 4500 обладает 512-мегабайтным фрейм-буфером.
Увеличенные частоты графического процессора, а также желание сделать карту тихой, привело к тому, что платы NVIDIA Quadro FX 4500 обладают специальной системой охлаждения. Этот кулер занимает пространство, отводимое на соседний слот расширения на материнской плате, он снабжён четырьмя тепловыми трубками и имеет 80-миллиметровый вентилятор. Такие хитрости позволили достичь весьма осязаемого результата с точки зрения эффективности охлаждения: она повысилась на 50% по сравнению с кулерами, устанавливаемыми на карты предыдущего поколения. При этом уровень шума от такой системы охлаждения понизился на 30%, поскольку вентилятору не приходится раскручиваться до высокого уровня оборотов.
NVIDIA Quadro FX 4500 оборудуется двумя DVI выходами, а также имеет поддержку технологии SLI. Таким образом, экстремальные профессионалы (или профессиональные экстремалы?) смогут насладиться ещё более высокой производительностью, нежели способна обеспечить одна карта NVIDIA Quadro FX 4500, а также получить доступ к полноэкранному сглаживанию FSAA 32x и к возможности одновременного использования до четырёх мониторов.
Первый старт
С описанием комплектующих, подобранных нами для сборки двухпроцессорной рабочей станции, покончено. Самое время рассказать о том, как всё это работает вместе. После установки в материнскую плату процессоров с охладителями, памяти и видеокарты мы получили вот такую систему:
Честно говоря, предполагалось, что с запуском такой системы у нас не должно возникнуть никаких проблем. Всё-таки для формирования этой платформы были использованы очень дорогие и высококачественные комплектующие. Кроме того, по логике, производители должны уделять особое внимание вопросам надёжности, стабильности и совместимости оборудования для серверов и рабочих станций. Однако надежды наши не оправдались. Собранная система напрочь отказывалась проходить POST и зависала сразу за инициализацией видео, не давая даже войти в BIOS Setup.
С локализацией проблемы также возникли некоторые трудности. Наш штатный индикатор POST-кодов с PCI интерфейсом попросту не влез в материнскую плату. Система охлаждения NVIDIA Quadro FX 4500 перекрывала один из двух слотов PCI и не позволяла устанавливать во второй слот карты, имеющие выпирающие детали на оборотной стороне. К сожалению POST-индикатор имел на оборотной стороне собственно LED индикатор, поэтому, для того, чтобы установить его в систему, пришлось временно поставить в ASUS K8N-DL другую видеокарту с системой охлаждения нормального размера.
Кстати, используемая нами материнская плата ASUS K8N-DL в процессе загрузки отображает некоторые POST коды на экране, однако нам это свойство платы совершенно не помогло, поскольку система зависала до того, как эти коды начинали выдаваться.
Столкнувшись с описанными неприятностями, первым делом мы предположили, что проблема кроется в BIOS. Плата пришла к нам с BIOS версии 1003 и, судя по косвенным признакам, эта прошивка не имеет полноценной поддержки двухъядерных CPU. На сайте ASUS была найдена более новая версия BIOS, 1004, но как её прошить, если плата останавливается в самом начале POST?
К счастью, и это препятствие преодолеть удалось. Как оказалось, материнская плата ASUS K8N-DL с BIOS версии 1003 отвратно ведёт себя только в том случае, если в ней установлено два двухъядерных процессора. Очевидно, что четыре ядра для этой версии BIOS – многовато. Если же оставить в плате лишь один двухъядерный процессор, то запустить её удаётся. Благодаря этой находке мы и прошили новую версию BIOS 1004, которая смогла нормально функционировать уже с двумя двухъядерными процессорами.
Выполнив перепрошивку и вернув на место видеокарту NVIDIA Quadro FX 4500, нам без проблем удалось установить операционную систему, которая с радостью обнаружила все четыре процессорных ядра.
Чтобы закрепить достигнутый успех, а также получить первое представление об уровне производительности полученной двухпроцессорной системы, построенной с использованием двухъядерных процессоров, мы запустили синтетический бенчмарк из пакета SiSoft Sandra 2005 SP2. Впечатляющий результат не заставил себя долго ждать:
Судя по полученным показателям, наша рабочая станция обладает колоссальным запасом мощности. Особенно радует результат измерения пропускной способности памяти. Вот она, технология NUMA в действии. Что же касается результатов арифметических тестов, то и они способны подарить поклонникам AMD несколько приятных минут. Алгоритмы, применённые в бенчмарках SiSoft Sandra 2005, хорошо распараллеливаются. Поэтому наша система, в которой применены двухъядерные CPU, способна обгонять даже обычные четырёхпроцессорные платформы, не говоря уж о двухпроцессорных системах, основанных на CPU семейства Intel Xeon.
Впрочем, SiSoft Sandra 2005 SP2 назвать серьёзным тестом нельзя. Настоящее же тестирование рабочей станции – впереди.
Как мы тестировали
В качестве соперников собранной нами двухпроцессорной рабочей станции на базе двухъядерных процессоров Opteron мы выставили самые современные и дорогие настольные системы, укомплектованные 2 Гбайтами оперативной памяти и профессиональной графической картой NVIDIA Quadro FX 4500. Таким образом, производительность двухпроцессорной системы мы сравнивали с быстродействием платформ, основанных на самых дорогих процессорах семейств Athlon 64 X2, Athlon 64 FX, Pentium Extreme Edition и Pentium 4 Extreme Edition. Кроме того, мы протестировали платформу на базе платы ASUS K8N-DL с одним двухъядерным процессором, чтобы получить полное представление об изменении уровня быстродействия при увеличении количества ядер в системе с двух до четырёх с сохранением постоянной тактовой частоты.
Таким образом, в нашем тестировании использовались следующие комплектующие:
- Процессоры:
- AMD Athlon 64 X2 4800+ (Socket 939, 2.4 ГГц, 2 x 1024KB L2, ревизия ядра E6 - Toledo);
- AMD Athlon 64 FX-57 (Socket 939, 2.8 ГГц, 1024KB L2, ревизия ядра E4 – San Diego);
- AMD Opteron 875 (Socket 940, 2.2 ГГц, 2 x 1024KB L2, ревизия ядра E1 – Egypt);
- Intel Pentium Extreme Edition 840 (LGA775, 3.2 ГГц, 2 x 1MB L2);
- Intel Pentium 4 Extreme Edition 3.73 ГГц (LGA775, 3.73 ГГц, 2MB L2).
- Материнские платы:
- ASUS P5WD2 Premium (LGA775, Intel 955X);
- ASUS K8N-DL (Dual Socket 940, NVIDIA nForce Professional);
- DFI NF4 Ultra-D (Socket 939, NVIDIA nForce4 Ultra).
- Память:
- 2048MB DDR400 SDRAM (Corsair CMX512-3200XLPRO, 4 x 512MB, 2-2-2-10);
- 2048MB Registered DDR400 SDRAM (Kingston HyperX KRX3200AK2/1G, 4 x 512MB, 2.5-3-3-6);
- 2048MB DDR2-667 SDRAM (Corsair CM2X512A-5400UL, 4 x 512MB, 4-4-4-14).
- Графическая карта: NVIDIA Quadro FX 4500 (PCI-E x16).
- Дисковая подсистема: Maxtor MaXLine III 250GB (SATA150).
- Операционная система: Microsoft Windows XP SP2.
Следует заметить, что нам пришлось отказаться от идеи проведения тестирования в 64-битной операционной системе Windows XP Professional x64 Edition, поскольку некоторые из профессиональных программных продуктов пока что имеют ограниченную совместимость с этой новой ОС.
Производительность
Прежде чем перейти к обсуждению результатов тестирования, пару слов необходимо сказать о системе обозначений, принятой на диаграммах. Несмотря на то, что фактически в тестах принимали участие процессоры Opteron 875, результаты двухпроцессорной станции мы будем обозначать в "правильных" терминах. То есть, она будет фигурировать под названием Dual Opteron 275. Результаты этой же рабочей станции, но с одним установленным процессором при этом мы будем обозначать как Single Opteron 175.
Futuremark PCMark05
Начать тестирование мы решили с использования популярного теста PCMark05 от Futuremark. Хотя его и нельзя отнести к профессиональным приложениям, посмотреть результат двухпроцессорной системы в нём будет весьма любопытно. Тем более что этот бенчмарк содержит сценарии, запускающие четыре параллельных потока. А это – как раз то, что нужно для полной нагрузки нашей рабочей станции, построенной на базе двух двухъядерных CPU.
Как и ожидалось, процессорный бенчмарк показывает преимущество двухпроцессорной системы над однопроцессорной. Рабочая станция с двумя процессорами Opteron 275 обгоняет аналог с одним процессором Opteron 175 примерно на 25%. Благодаря этому она становится самой быстрой системой (по данным PCMark05) среди участвующих в тестировании.
Однако следует отметить и высокий результат, показанной платформой на базе процессора Pentium Extreme Edition 840. Этот CPU также может исполнять четыре вычислительных потока одновременно, так как в нём содержится два процессорных ядра, а также поддерживается технология "виртуальной многоядерности" Hyper-Threading.
Тест памяти из того же пакета PCMark05 позволяет получить довольно-таки странный результат. Как мы видим, двухпроцессорная рабочая станция на базе двухъядерных CPU Opteron показывает достаточно скудный результат. Это не было бы удивительным, если бы двухпроцессорная система не поддерживала технологию NUMA, так как регистровые модули обладают более низким быстродействием, чем их небуферизованные собратья. Но в данном случае двухпроцессорная система имеет 4 канала для доступа к памяти и, по идее, должна быть как минимум не медленнее, чем аналогичная платформа с одним установленным процессором.
Впрочем, столь странное на первый взгляд поведение Dual Opteron 275 имеет под собой логичное объяснение. Для того чтобы получить дивиденд от технологии NUMA, в память необходимо обращаться как минимум двумя независимыми потоками. Тест же памяти в PCMark05 – однопоточный, потому он и не может показать в полной мере то, на что способна подсистема памяти двухпроцессорной системы на базе Opteron.
ScienceМark 2.0
Бенчмарк ScienceMark 2.0 показывает производительность при использовании типичных научных алгоритмов, используемых в методах математического моделирования.
Полученные данные несколько озадачивают. Хотя совершенно очевидно, что на двухъядерных процессорах этот тест работает несколько быстрее, чем на одноядерных, добавление в систему второго двухъядерного CPU результат в тесте не увеличивает. Впрочем, и в этом случае логичное объяснение находится. ScienceMark имеет оптимизацию под двухъядерные системы, заключающуюся в выполнении параллельных вычислений двумя потоками. Однако наша двухпроцессорная система обладает четырьмя вычислительными ядрами, и показывает максимальную производительность именно при выполнении четырёх "ниток" вычислений. Поэтому, для того, чтобы получить выигрыш от добавления в систему второго двухъядерного процессора, нужна более глубокая оптимизация, которой в ScienceMark 2.0 нет.
Кодирование видео
При тестировании двухъядерных процессоров для настольного сегмента, мы отметили, что современные видеокодеки поддерживают многопоточность. Давайте посмотрим, как скажется на скорости кодирования видео использование более серьёзной системы, содержащей два двухъядерных CPU.
Ситуация в популярных кодеках в целом напоминает картину, наблюдаемую нами в ScienceMark. И причины этого примерно те же. Разработчики кодеков не так давно смогли оптимизировать свои продукты для систем, способных исполнять два вычислительных потока одновременно, а мы хотим от них уже поддержки четырёхпроцессорности... К сожалению, большинство кодеков пока загрузить работой четыре процессорных ядра оказывается не в состоянии.
Обработка видео
При тестировании двухъядерных процессоров мы уже отмечали хорошую оптимизацию системы нелинейного видеомонтажа Adobe Premiere и программного пакета для создания визуальных эффектов и компьютерной графики Adobe After Effects под многопроцессорные системы. Давайте посмотрим, как в этих популярных приложениях сможет проявить себя рабочая станция на базе двух процессоров Opteron 275.
Если нелинейный видеомонтаж и последующая обработка видео входит в круг ваших профессиональных интересов, то двухпроцессорная система на базе двухъядерных Opteron может оказаться как нельзя более кстати. Такая рабочая станция с четырьмя вычислительными ядрами позволяет сильно поднять производительность работы в Adobe Premiere Pro и Adobe After Effects. Так, прирост производительности при добавлении второго двухъядерного процессора в систему составляет 71% в Adobe Premiere Pro и 14% в Adobe After Effects. При этом рабочая станция на базе Opteron 275 с большим запасом обгоняет все платформы, построенные на процессорах для настольных компьютеров верхней ценовой категории.
Обработка изображений
Как мы уже убедились, компания Adobe ответственно подошла к вопросу оптимизации своих программных продуктов под многопроцессорные системы. Интересно, распространяется ли это правило на Adobe Photoshop – один из самых популярных графических редакторов, применяемый и профессионалами, и любителями?
Результаты теста однозначно говорят о том, что Photoshop, также как и приложения для работы с видео, получает существенный прирост производительности от добавления дополнительных вычислительных ресурсов. Так, система с двумя двухъядерными процессорами оказывается быстрее аналогичной системы с одним двухъядерным процессором примерно на 20%. Благодаря такому преимуществу, платформа, построенная на Dual Opteron 275, опережает самые быстрые системы с десктопными процессорами.
3ds max 7
Программный пакет 3ds max 7 в представлении не нуждается. Это популярный пакет для профессиональной трехмерной анимации и моделирования. Оценку производительности систем в этом пакете мы проводили при помощи скрипта SPECapc. Этот тест выдаёт две метрики: первую – характеризующую производительность систем при работе с окнами проекций и вторую – описывающую скорость финального рендеринга.
Как показывают полученные результаты, 3ds max 7 при работе с окнами проекций многопоточность попросту не задействует. Поэтому, наиболее быстрой системой здесь оказывается платформа, построенная на одном одноядерном процессоре Athlon 64 FX-57 с тактовой частотой 2.8 ГГц.
Зато на скорость рендеринга количество процессорных ядер оказывает самое непосредственное влияние. Система на Dual Opteron 275 обгоняет аналог с одним процессором Opteron 175 на 47% и становится недосягаемым лидером в нашем тесте.
Maya 6.5
Maya – это ещё один профессиональный пакет, служащий для создания трёхмерной графики. Тестирование в нём выполнялось с помощью двух бенчмарков: SPECapc при работе с окнами проекции и ZooRender для оценки скорости финального рендеринга в этой программе.
Ситуация с работой в окнах проекции складывается также, как и в 3ds max. Многопроцессорность в данном случае попросту не нужна.
Зато при финальном рендеринге разница в производительности однопроцессорной и двухпроцессорной системы на базе двухъядерных Opteron просто потрясающа. Добавление второго CPU даёт возможность увеличить скорость рендеринга в Maya почти в два раза – на 93%.
Lightwave (8)
Lightwave представляет собой ещё один распространённый пакет 3D графики. В нём мы измерили скорость финального рендеринга двух тестовых сцен.
Мы уже неоднократно отмечали тот факт, что скорость финального рендеринга в Lightwave сильно зависит от структуры сцены. В данном случае этот тезис находит подтверждение. Тем не менее, в обоих случаях наша рабочая станция ведёт себя весьма достойно, демонстрируя наивысшую производительность среди всех протестированных систем.
CINEBENCH 2003
Специальный тест CINEBENCH 2003 показывает производительность систем в трёхмерном пакете Cinema 4D, пользующемся особой популярностью у поклонников платформы Mac.
Рендеринг на двухпроцессорной системе выполняется с очень высокой скоростью. Прирост производительности по сравнению с аналогичной однопроцессорной системой составляет 74%.
Что же касается работы в OpenGL, то тут многопоточность системой не поддерживается и Dual Opteron 275 демонстрирует весьма скромную скорость.
AutoCAD 2006
AutoCAD 2006 – это популярный программный продукт для автоматизированного проектирования и конструирования.
Также как и при работе с окнами проекции в пакетах для 3D моделирования, многопоточность в AutoCAD не используется. Поэтому, самым быстрым процессором в данном приложении оказывается AMD Athlon 64 FX-57.
SolidWorks 2005
SolidWorks 2005 представляет собой интегрированную среду трехмерного моделирования деталей, создания сборок и проектирования чертежей на их основе. Для тестирования в этом приложении мы воспользовались тестом от SPECapc.
Как и в AutoCAD, в SolidWorks 2005 многопроцессорность остаётся невостребованной. Таким образом, использование двухъядерных CPU и многопроцессорных систем в таких приложениях не даёт никакого положительного эффекта.
Выводы
Глядя на результаты тестирования рабочей станции, построенной на двух двухъядерных процессорах AMD Opteron 275, можно сделать много интересных выводов. Но в первую очередь, конечно, необходимо восхититься компанией AMD, которая смогла создать и довести до стадии массового производства двухъядерные процессоры для серверов и рабочих станций, обогнав в этом начинании Intel. Причём, внедрение двухъядерных архитектур на этот рынок даёт пользователям вполне видимый эффект. Благодаря этому, двухпроцессорные системы на базе новых Opteron c двумя ядрами могут похвастать беспрецедентным уровнем производительности среди платформ данного класса. Впрочем, довольно эпитетов.
А конкретно можно сказать вот что. Несмотря на то, что потенциально системы, подобные протестированной в этом обзоре, имеют достаточно высокий запас вычислительной мощности, воспользоваться им в полной мере пользователи могут далеко не всегда. С многопроцессорными серверами в этом плане ситуация гораздо проще. Поскольку серверные приложения многопоточны по своей природе, то использование пары двухъядерных CPU вместо одноядерных даст выигрыш в производительности практически всегда. Что же касается рабочих станций, то при выборе процессоров для них в первую очередь следует задуматься о тех приложениях, быстродействие в которых наиболее критично, исходя из задач, возлагаемых на рабочую станцию.
Как показало наше тестирование, многие приложения профессионального уровня не оптимизированы под многопроцессорные системы, а некоторые оптимизированы под платформы с числом исполнительных ядер не более двух. Программы же, которые могут использовать возможности пары двухъядерных CPU семейства Opteron, не столь распространены. К ним относятся все задачи трёхмерного рендеринга, выполняемого в любых пакетах, а также профессиональные программные пакеты для редактирования видео и изображений. Во всех остальных случаях толк от использования системы с четырьмя ядрами будет небольшой.
Например, системы автоматизированного проектирования, а также работа в окнах проекции в системах трёхмерного моделирования используют лишь один вычислительный поток. Поэтому, для этих применений гораздо более эффективным вложением средств будет приобретение единственного высокочастотного одноядерного процессора и более мощной профессиональной графической карты.
Показателен пример и с перекодированием видео. Большинство видеокодеков оказалось способно эффективно работать лишь на двухъядерной системе. При добавлении второго двухъядерного процессора его вычислительные мощности оказываются незадействованными, и прироста скорости не наблюдается. Подобным свойством отличаются и некоторые другие приложения. В этих случаях использование двухпроцессорной системы с CPU класса Opteron 275 также будет неоправданным: оптимальным выбором для таких задач будет двухпроцессорная система с одноядерными CPU, либо однопроцессорная система с двухъдерными CPU.
При тестировании первых процессоров с двумя ядрами, нацеленных на использование в настольных компьютерах, мы уже сокрушались по поводу того, что приложений, загружающих два ядра не так уж и много. Тестирование платформы Dual Opteron 275 расстроило ещё больше. Программных продуктов, способных использовать мощности, предлагаемые этой платформой в полной мере, совсем немного. Так что до массового внедрения четырёхъядерных CPU разработчики программного обеспечения должны будут провести большую работу.
Выражаем благодарность дистрибьютеру ASUS - компании ПИРИТ - за предоставление на тестирование материнской платы ASUS K8N-DL.
реклама
Лента материалов раздела
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила