Тестирование восьмиядерного сервера.

для раздела Блоги

Введение

Попал мне в руки восьмиядерный сервер Newisys 4300 на базе четырех процессоров AMD Opteron 885 (2,6 GHz) и решил я сравнить его процессорное быстродействие с обычными рабочими станциями.
Цель тестирования - проверить масштабируемость производительности при увеличении количества ядер и заодно посмотреть насколько оптимизированы некоторые приложения под многопоточность, к тому же производители процессоров акцентируют свою направленность на увеличение производительности за счет увеличения количества ядер. Не далек тот день, когда в стандартном ПК может появиться столь большое по сегодняшним меркам количество ядер.

Краткий обзор тестовых железок

В обзоре приняли участие восемь систем из которых рассматривал тринадцать конфигураций:

1) Мой домашний ПК:

CPU: AMD Athlon64 X2 4400@2805MHz
MoBo: Asus A8N-E (CapMod, Vmod CPU 1,6V,Vmod Chip 1,6V)
RAM: 2*1024 KINGMAX (MPXD42D-D8KB3 BGA чипы KDL88T4AA-50)3-3-3-8-1T-255MHz, 2,8В
Video: MSI GF7900GT 468/662@740/820(Vmod GPU 1,55V)
Охлаждение: СВО - Насос циркуляционный Grundfos UPS25-40, алюминиевая батарея (6 секций), самодельные водоблоки CPU,GPU,Chipset,Mosfet.
БП: Thermaltake ToughPower 650W W0104RE
Корпус: Самодельный рэковый 19" 3U


(кликните по картинке для увеличения)


Рассматривались две конфигурации:
Athlon64 x2 4400 (2Mb) (255*11) 2048Mb DDR-510 3-3-3-8-1
Athlon64 x2 4400 (2Mb) (201*11) 2048Mb DDR-402 3-3-3-8-1

2) Системы на базе Intel965P:

CPU: Intel Core Duo E6700 (4Mb) 2660MHz@3600MHz(1,45V), Intel P4 650 HT(2Mb) 3400MHz@4000MHz
MoBo: Gigabyte GA-965P-DS4 Bios F7b
RAM: 4*1024 Corsair CM2X1024-6400 DDR-2-800 4-4-4-12 2,1V
Video: MSI GF7900GTX
Охлаждение: Thermaltake Big Typhoon VX
HDD:RAID1 150 Gb (2*HDD 150 Gb SATA150 Western Digital Raptor <1500ADFD> 10000rpm 16Mb)
RAID1 750 Gb (2*HDD 750 Gb SATA-II 300 Seagate Barracuda 7200.10 <3750640AS> 7200rpm 16Mb)
БП: Thermaltake ToughPower 650W W0104RE
Корпус: Miditower Thermaltake <VA3400BWAE(D)> Black Window Tsunami Dream ATX Aluminum


(кликните по картинке для увеличения)



(кликните по картинке для увеличения)



(кликните по картинке для увеличения)


Рассматривались пять конфигураций:
Core Duo E6700 (4Mb)-3600 (10*360) 4096Mb DDR-2-900 5-5-5-15
Core Duo E6700 (4Mb)-2660 (10*266) 4096Mb DDR-2-800 4-4-4-12
Core Duo E6700 (4Mb)-2660 (10*266) 4096Mb DDR-2-800 5-5-5-15
P4 650 HT (2Mb)-4000 (17*235) 4096Mb DDR-2-940 5-5-5-15
P4 650 HT (2Mb)-3400 (17*200) 4096Mb DDR-2-800 4-4-4-12

3) Восьмиядерная система Newisys 4300:

CPU: 4*Opteron885 (13*200) 2600MHz
MoBo: Newisys (AMD8100)
RAM: 8*1024Mb DDR-400 ECC Reg 3-3-3-8-1 (Память установлена по два модуля на каждый процессор)


(кликните по картинке для увеличения)



(кликните по картинке для увеличения)

8 ядерный сервер


(кликните по картинке для увеличения)

8 ядерный сервер - дополнительная плата


(кликните по картинке для увеличения)



8 ядерный сервер - HT линки

4) Четырехядерная система Opteron:

CPU: 2*Opteron265 (9*200) 1800MHz
MoBo: Supermicro H8DA8 (AMD8100)
RAM: 4*1024Mb DDR-400 ECC Reg 3-3-3-8-1 (Память установлена по два модуля на каждый процессор)

5) Двуядерная система IBM 326

CPU: 1*Opteron275 (11*200) 2200MHz
MoBo: MS-9145 (AMD8100)
RAM: 2*1024Mb DDR-400 ECC Reg 3-3-3-8-1

6) Двухпроцессорная система Xeon

CPU: 2*Xeon HT (1Mb) (15*200) 3000MHz
MoBo: Tyan S5360
RAM: 2*1024Mb DDR-333 ECC Reg 3-3-3-8-1

7) Обычный домашний ПК

CPU: AthlonXP 2500 (512Kb) (11*176) 1936MHz
MoBo: Gigabyte GA-7N400
RAM: 2*512Mb Kingston DDR352 2,5-3-3-7

8) Второй мой ПК

CPU: 2*P3 1000 (256Kb)@1125 (7,5*150)
MoBo: Epox D3VA (VIA Appolo133Pro)
RAM: 2*256Mb ECC 2-2-2-5-150MHz (Kingston KVR133X72C2/256)


(кликните по картинке для увеличения)

Epox D3VA


Тестовые программы

В качестве операционной системы была выбрана Windows XP Professional Edition Service Pack 2 для систем 1,2,7,8 и Windows 2003 x64 для 3,4,5,6.
Для тестирования был использован следующий набор синтетических бенчмарков и программного обеспечения:

Everest 3.01.704

CrystalMark2004 0.9.115.278

Rmcpulite_2005_v13 - первая сцена с дефолтными настройками,автоматическим выбором MMX/SSE и максимальным количеством потоков
использовался показатель Renderer FPS

WinRar 3.61 встроенный тест с включенной многопоточностью - результат KB/s

7zip 4.42 встроенный тест (настройки дефолтные) с включенной многопоточностью - результат общий MIPS
Единственный нюанс - 7zip использовался 64-х битный на системах 3,4,5,6 и его результат примерно на 10% выше 32-х разрядной версии.

Проект Folding@Home


Результаты тестирования

Everest 3.01.704































CrystalMark2004 0.9.115.278










Rmcpulite_2005_v13




WinRar 3.61




7zip 4.42





Folding@Home

18xx(Amber) использует около 10Мб оперативной памяти
24xx(Gromacs) использует около 120Мб оперативной памяти

4*Opteron885(2,6GHz),8196Mb DDR400 ECC Reg (3-3-3-8-1)

1975 очков в сутки при запуске четырех задач 18xx(Amber) и четырех 24xx(Gromacs)

http://forums.overclockers.ru/viewtopic.php?p=3118010#3118010
Скорость 24xx(Gromacs) на этой системе доходит до 320 очков в сутки на поток, что гораздо больше чем 18xx(Amber) - до 193 очков в сутки, но при увеличении более четырех 24xx(Gromacs) потоков начинается резкое снижение скорости, до 140 очков в сутки на поток 24xx(Gromacs).
18xx(Amber) при увеличении до восьми потоков скорость не снижает.

Intel CoreDuo E6700@3600MHz,4196Mb DDR2-900 (5-5-5-15)

1236 очков в сутки при запуске двух задач 24xx(Gromacs)
http://forums.overclockers.ru/viewtopic.php?p=3137479#3137479

Заключение

Безусловно чисто процессорное быстродействие оказалось впечатляющим на вомьми ядрах, но можно видеть, что Intel CoreDuo E6700@3600MHz уже не сильно отстает, а разогнанные четырехядерные Intel Core вполне могут превзойти 4*Opteron885.
Еще у многопроцессорных систем AMD наблюдается падение производительности памяти с увеличением числа ядер, к сожалению не было на момент тестирования системы 4*Xeon, чтобы сравнить насколько происходит падение производительности памяти на разных архитектурах.
Также не впечатлило быстродействие памяти на системе Intel 965P.
Зато Intel CoreDuo на той же системе просто на голову :) выше Intel P4.

В реальных приложениях часто слабым местом становится пропускная способность оперативной памяти, только некоторые приложения могут показывать практически линейный прирост быстродействия от количества ядер - в основном програмный рендер.

Кстати Winrar использует все 8 ядер, в то время как 7Zip только 4 ядра.
Опять же в архиваторах наблюдается приличное понижение быстродействия при увеличении количества ядер, может из-за плохой оптимизации под мультипоточность, но скорее всего из-за пропускной способности оперативной памяти.

Folding@Home
Я так понимаю, что 18xx(Amber) хорошо кешируется из-за малого объема используемой памяти, в отличии от 24xx(Gromacs). Похоже, что упирается всё в междуядерные линки HT (которые к тому же не равнозначные между ядрами), т.к. используемые данные могут находиться в любом банке памяти, и ядрам часто приходится брать данные с контроллера памяти другого процессора.

Общаемся здесь http://forums.overclockers.ru/viewtopic.php?t=167882
Telegram-канал @overclockers_news - это удобный способ следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают