Тестирование восьмиядерного сервера.
Попал мне в руки восьмиядерный сервер Newisys 4300 на базе четырех процессоров AMD Opteron 885 (2,6 GHz) и решил я сравнить его процессорное быстродействие с обычными рабочими станциями.
Цель тестирования - проверить масштабируемость производительности при увеличении количества ядер и заодно посмотреть насколько оптимизированы некоторые приложения под многопоточность, к тому же производители процессоров акцентируют свою направленность на увеличение производительности за счет увеличения количества ядер. Не далек тот день, когда в стандартном ПК может появиться столь большое по сегодняшним меркам количество ядер.
Краткий обзор тестовых железок
В обзоре приняли участие восемь систем из которых рассматривал тринадцать конфигураций:
1) Мой домашний ПК:
CPU: AMD Athlon64 X2 4400@2805MHz
MoBo: Asus A8N-E (CapMod, Vmod CPU 1,6V,Vmod Chip 1,6V)
RAM: 2*1024 KINGMAX (MPXD42D-D8KB3 BGA чипы KDL88T4AA-50)3-3-3-8-1T-255MHz, 2,8В
Video: MSI GF7900GT 468/662@740/820(Vmod GPU 1,55V)
Охлаждение: СВО - Насос циркуляционный Grundfos UPS25-40, алюминиевая батарея (6 секций), самодельные водоблоки CPU,GPU,Chipset,Mosfet.
БП: Thermaltake ToughPower 650W W0104RE
Корпус: Самодельный рэковый 19" 3U

(кликните по картинке для увеличения)
Рассматривались две конфигурации:
Athlon64 x2 4400 (2Mb) (255*11) 2048Mb DDR-510 3-3-3-8-1
Athlon64 x2 4400 (2Mb) (201*11) 2048Mb DDR-402 3-3-3-8-1
2) Системы на базе Intel965P:
CPU: Intel Core Duo E6700 (4Mb) 2660MHz@3600MHz(1,45V), Intel P4 650 HT(2Mb) 3400MHz@4000MHz
MoBo: Gigabyte GA-965P-DS4 Bios F7b
RAM: 4*1024 Corsair CM2X1024-6400 DDR-2-800 4-4-4-12 2,1V
Video: MSI GF7900GTX
Охлаждение: Thermaltake Big Typhoon VX
HDD:RAID1 150 Gb (2*HDD 150 Gb SATA150 Western Digital Raptor <1500ADFD> 10000rpm 16Mb)
RAID1 750 Gb (2*HDD 750 Gb SATA-II 300 Seagate Barracuda 7200.10 <3750640AS> 7200rpm 16Mb)
БП: Thermaltake ToughPower 650W W0104RE
Корпус: Miditower Thermaltake <VA3400BWAE(D)> Black Window Tsunami Dream ATX Aluminum

(кликните по картинке для увеличения)

(кликните по картинке для увеличения)

(кликните по картинке для увеличения)
Рассматривались пять конфигураций:
Core Duo E6700 (4Mb)-3600 (10*360) 4096Mb DDR-2-900 5-5-5-15
Core Duo E6700 (4Mb)-2660 (10*266) 4096Mb DDR-2-800 4-4-4-12
Core Duo E6700 (4Mb)-2660 (10*266) 4096Mb DDR-2-800 5-5-5-15
P4 650 HT (2Mb)-4000 (17*235) 4096Mb DDR-2-940 5-5-5-15
P4 650 HT (2Mb)-3400 (17*200) 4096Mb DDR-2-800 4-4-4-12
3) Восьмиядерная система Newisys 4300:
CPU: 4*Opteron885 (13*200) 2600MHz
MoBo: Newisys (AMD8100)
RAM: 8*1024Mb DDR-400 ECC Reg 3-3-3-8-1 (Память установлена по два модуля на каждый процессор)

(кликните по картинке для увеличения)

(кликните по картинке для увеличения)
8 ядерный сервер

(кликните по картинке для увеличения)
8 ядерный сервер - дополнительная плата

(кликните по картинке для увеличения)

8 ядерный сервер - HT линки
4) Четырехядерная система Opteron:
CPU: 2*Opteron265 (9*200) 1800MHz
MoBo: Supermicro H8DA8 (AMD8100)
RAM: 4*1024Mb DDR-400 ECC Reg 3-3-3-8-1 (Память установлена по два модуля на каждый процессор)
5) Двуядерная система IBM 326
CPU: 1*Opteron275 (11*200) 2200MHz
MoBo: MS-9145 (AMD8100)
RAM: 2*1024Mb DDR-400 ECC Reg 3-3-3-8-1
6) Двухпроцессорная система Xeon
CPU: 2*Xeon HT (1Mb) (15*200) 3000MHz
MoBo: Tyan S5360
RAM: 2*1024Mb DDR-333 ECC Reg 3-3-3-8-1
7) Обычный домашний ПК
CPU: AthlonXP 2500 (512Kb) (11*176) 1936MHz
MoBo: Gigabyte GA-7N400
RAM: 2*512Mb Kingston DDR352 2,5-3-3-7
8) Второй мой ПК
CPU: 2*P3 1000 (256Kb)@1125 (7,5*150)
MoBo: Epox D3VA (VIA Appolo133Pro)
RAM: 2*256Mb ECC 2-2-2-5-150MHz (Kingston KVR133X72C2/256)

(кликните по картинке для увеличения)
Epox D3VA
Тестовые программы
В качестве операционной системы была выбрана Windows XP Professional Edition Service Pack 2 для систем 1,2,7,8 и Windows 2003 x64 для 3,4,5,6.
Для тестирования был использован следующий набор синтетических бенчмарков и программного обеспечения:
Everest 3.01.704
CrystalMark2004 0.9.115.278
Rmcpulite_2005_v13 - первая сцена с дефолтными настройками,автоматическим выбором MMX/SSE и максимальным количеством потоков
использовался показатель Renderer FPS
WinRar 3.61 встроенный тест с включенной многопоточностью - результат KB/s
7zip 4.42 встроенный тест (настройки дефолтные) с включенной многопоточностью - результат общий MIPS
Единственный нюанс - 7zip использовался 64-х битный на системах 3,4,5,6 и его результат примерно на 10% выше 32-х разрядной версии.
Проект Folding@Home
Результаты тестирования
Everest 3.01.704










CrystalMark2004 0.9.115.278



Rmcpulite_2005_v13

WinRar 3.61

7zip 4.42

Folding@Home
18xx(Amber) использует около 10Мб оперативной памяти
24xx(Gromacs) использует около 120Мб оперативной памяти
4*Opteron885(2,6GHz),8196Mb DDR400 ECC Reg (3-3-3-8-1)
1975 очков в сутки при запуске четырех задач 18xx(Amber) и четырех 24xx(Gromacs)
https://forums.overclockers.ru/viewtopic.php?p=3118010#3118010
Скорость 24xx(Gromacs) на этой системе доходит до 320 очков в сутки на поток, что гораздо больше чем 18xx(Amber) - до 193 очков в сутки, но при увеличении более четырех 24xx(Gromacs) потоков начинается резкое снижение скорости, до 140 очков в сутки на поток 24xx(Gromacs).
18xx(Amber) при увеличении до восьми потоков скорость не снижает.
Intel CoreDuo E6700@3600MHz,4196Mb DDR2-900 (5-5-5-15)
1236 очков в сутки при запуске двух задач 24xx(Gromacs)
https://forums.overclockers.ru/viewtopic.php?p=3137479#3137479
Заключение
Безусловно чисто процессорное быстродействие оказалось впечатляющим на вомьми ядрах, но можно видеть, что Intel CoreDuo E6700@3600MHz уже не сильно отстает, а разогнанные четырехядерные Intel Core вполне могут превзойти 4*Opteron885.
Еще у многопроцессорных систем AMD наблюдается падение производительности памяти с увеличением числа ядер, к сожалению не было на момент тестирования системы 4*Xeon, чтобы сравнить насколько происходит падение производительности памяти на разных архитектурах.
Также не впечатлило быстродействие памяти на системе Intel 965P.
Зато Intel CoreDuo на той же системе просто на голову :) выше Intel P4.
В реальных приложениях часто слабым местом становится пропускная способность оперативной памяти, только некоторые приложения могут показывать практически линейный прирост быстродействия от количества ядер - в основном програмный рендер.
Кстати Winrar использует все 8 ядер, в то время как 7Zip только 4 ядра.
Опять же в архиваторах наблюдается приличное понижение быстродействия при увеличении количества ядер, может из-за плохой оптимизации под мультипоточность, но скорее всего из-за пропускной способности оперативной памяти.
Folding@Home
Я так понимаю, что 18xx(Amber) хорошо кешируется из-за малого объема используемой памяти, в отличии от 24xx(Gromacs). Похоже, что упирается всё в междуядерные линки HT (которые к тому же не равнозначные между ядрами), т.к. используемые данные могут находиться в любом банке памяти, и ядрам часто приходится брать данные с контроллера памяти другого процессора.
Общаемся здесь https://forums.overclockers.ru/viewtopic.php?t=167882
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Сейчас обсуждают