Сравнение AMD K6-III+, AMD Athlon XP и AMD Athlon 64 на равной частоте (600 МГц)

для раздела Блоги
Начислено вознаграждение
Этот материал написан посетителем сайта, и за него начислено вознаграждение.

Целью статьи является сравнение платформ трёх поколений процессоров AMD: K6, K7 и K8. Каждый из представленных процессоров стал венцом развития своей платформы: К6-III+ получил большой кэш L2 объёмом 256 КБ и новый на тот момент техпроцесс 0,18 мкм, в то время как его предшественники изготавливались по технологическим нормам 0,25 мкм и L2-кэш присутствовал только у старшей модели K6-III, которая официально так и не покорила частотный порог в 450 МГц. AMD Athlon XP представлен последним ядром Barton с 512 КБ кэша и технологическим процессом по нормам 0,13 мкм. Для произвольного переключения множителя был взят мобильный вариант этого процессора, позволяющий свободно манипулировать множителем без необходимости хирургических операций над мостиками на кристаллоносителе. AMD Athlon 64 FX-57, изготовленный по 0,090 мкм техпроцессу с 1МБ L2-кэша, стал вершиной для платформы Socket 939, после него был выпущен двухъядерный FX-60, который в данном сравнении бесполезен, поскольку я поставил перед собой задачу сравнить ядра процессоров и отследить их прогресс от поколения к поколению. С этой же целью используется одни и те же видеокарта с SSD во всех трёх системах, а под Socket A и Socket 939 - один комплект памяти с теми же самыми настройками. 

реклама


Конфигурация стенда с AMD K6-III+:

реклама

AMD Socket 7 K6-III+ 550@600 MHz

Gigabyte GA-5AA (ALI Aladdin V) rev.3.2 firmware rev.F7B (beta)

реклама

512MB SDRAM Micron PC133 2-2-2-5 BGA-chips

128MB ATI FireGL 8800 (IBM) Catalyst 8.03.98.4

реклама

120GB SSD Crucial with IDE/SATA adapter  


реклама


Конфигурация стенда с AMD Athlon XP:

AMD Socket A Athlon XP-M@600 MHz

Epox EP-8VTAI (VIA KT880 + VT8237)

2048MB DDR400@133 Patriot 2-2-2-6

128MB ATI FireGL 8800 (IBM) Catalyst 8.03.98.4

120GB SSD Crucial with IDE/SATA adapter 


Конфигурация стенда с AMD Athlon 64:

AMD Socket 939 Athlon 64 FX-57@600 MHz

Epox EP-9NDA3I (NVIDIA nForce3 250 Ultra)

2048MB DDR400@133 Patriot 2-2-2-6

128MB ATI FireGL 8800 (IBM) Catalyst 8.03.98.4

120GB SSD Crucial with IDE/SATA adapter 


Для того чтобы уравнять условия для всех трёх процессоров, оперативная память на Socket A и Socket 939 работает на частоте 66 МГц с таймингами 2-2-2-6, что эквивалентно SDR PC-133.  Для платформы Socket A была выбрана материнская плата на чипсете VIA KT880 в силу более лёгкой управляемости этого чипсета, который по большому счёту кардинально не менялся со времён KT266, эволюционируя с сохранением характерных черт всего семейства системной логики. А на nForce2 возникли проблемы с настройками мобильной версии Athlon XP  и оперативной памяти. Все три конфигурации были протестированы в наборе тестов из конкурса "Битва ветеранов - 2", проводившемся на данном сайте. Собственно, это соревнование и натолкнуло меня на мысль уравнять процессоры по частотам и посмотреть "чистую" разницу в производительности. Итак, вот эти тесты (результаты 3D Mark даны для справки):


Socket 7 Socket A Socket 939
Atomic CPU Test
CPU Mathmark
Mathmark
Nuclearus MultiCore v.1.0.0
Super PI 4M
TesteR v.0.107
WinRAR
Xlobuz v.099b3
3D Mark 2000
3D Mark 2001
3D Mark 2003


То же самое, но в цифрах:


Socket 7 Socket A Socket 939
Atomic CPU Test CPU 1905 1609 1643
FPU 1287 1898 1927
Кэш/Память 1536 2076 2617
CPU Mathmark Addition 13.53 3.359 3.406
Subtraction 12.918 3.297 3.328
Multiplication 13.339 3.203 3.172
Division 28.752 9.047 9.141
Simple Math 68.539 18.906 19.047
Prime Number Check 7.581 5.125 4.906
Calculating PI 28.34 10.157 10.187
Power Test 15.102 5.312 6.875
Complex Math 51.023 20.594 21.968
Total time 119.562 39.5 41.015
Mathmark
Addition 2.007 1.669 1.747
Substraction 1.995 3.266 3.25
Multiplication 3.698 3.1 3.161
Division 10.421 11.057 11.603
Sinus 4.215 4.947 4.846
Cosinus 4.444 4.958 4.996
Tangens 6.487 6.391 6.593
Atangens 6.636 7.845 7.95
Logarithm 6.139 5.818 6.156
Overal 44.047 45.785 47.052
Nuclearus MultiCore v.1.0.0
ALU Speed 541 665 1029
FPU Speed 513 790 882
MultiThread Speed 509 774 999
System Score 518 747 996
Super PI 4M
31:57 12:41 11:47
Tester v.0.107 Test 1 99.633 141.922 133.062
Test 2
11436
8597 8551
Test 3 10428 11086 11025
Test 4
32533
32485 32293
Test 5 44297 38536 38333
Score
2901
2512 2539
Xlobuz v.099b3
Test 1 499 590 625
Test 2 403 548 604
Test 3 468 603 594
Test 4 255 388 431
Test 5 224 409 406
All 1849 2538 2660

MadOnion 3DMark 2000 Pro v.1.1
(в скобках указаны значения для частоты 600 МГц процессора K6-III+)
без скобок - 625 МГц (5 х 125)
3DMark Result 3554 (3194) 4952 7031
CPU Speed 226 (206) 363 467
Game 1 Low Detail 65,0 (58,8) FPS 83,9 120,9
Game 1 Medium Detail 48,4 (43,5) FPS 64,1 92,3
Game 1 High Detail 35,3 (31,4) FPS 51,2 72,2
Game 2 Low Detail 94,2 (84,4) FPS 125,9 191,0
Game 2 Medium Detail 33,8 (30,5) FPS 54,3 69,4
Game 2 High Detail 19,5 (17,6) FPS 33,3 40,1
Fill Rate
(Single-Texturing)
1074,2 (1073,2) MTexels/s 1073,7 1070,2
Fill Rate
(Multi-Texturing)
2166,8 (2154,2) MTexels/s 2201,1 2193,3
High Polygon Count (1 Light) 9452 (7953) KTriangles/s 21968 22534
High Polygon Count (4 Lights) 8014 (6716) KTriangles/s 13978 14854
High Polygon Count (8 Lights) 7212 (6017) KTriangles/s 10543 11502
8MB Texture Rendering Speed 315,6 (299,6) FPS 379,2 570,7
16MB Texture Rendering Speed 175,5 (165,2) FPS 200,1 311,6
32MB Texture Rendering Speed 97,0 (91,7) FPS 100,0 160,2
64MB Texture Rendering Speed 50,9 (47,9) FPS 50,8 77,3
Bump Mapping (Emboss, 3-pass) 109,7 (110,1) FPS 240,4 251,2
Bump Mapping (Emboss, 2-pass) 160,0 (158,7) FPS 354,6 381,4
Bump Mapping (Emboss, 1-pass) 291,6 (285,4) FPS 618,4 668,1
Bump Mapping (Environment) 356,3 (329,5) FPS 441,9 439,2
MadOnion 3DMark 2001 SE
(в скобках указаны значения для частоты 600 МГц процессора K6-III+)
без скобок - 625 МГц (5 х 125)
3DMark Score 3479 (3123) 5477 6463
Game 1 Low Detail 35.6 (30.5) 64.5 84.5
Game 1 High Detail 8.4 (6.8) 19.3 24.0
Game 2 Low Detail 68.2 (60.4) 115.3 135.0
Game 2 High Detail 35.7 (32.0) 58.5 67.7
Game 3 Low Detail 44.7 (39.2) 73.0 89.9
Game 3 High Detail 17.9 (15.5) 31.1 38.4
Game 4 - Nature 37.8 (36.8) 38.5 38.3
Fill Rate (Single-Texturing) 790.2 (790.2) MTexels/s 911.0 911.0
Fill Rate (Multi-Texturing) 2249.8 (2257.1) MTexels/s 2239.8 2236.2
High Polygon Count (1 Light) 28.0 (26.9) MTriangles/s 34.0 38.4
High Polygon Count (8 Lights) 9.1 (8.7) MTriangles/s 10.8 10.3
Environment Bump Mapping 56.7 (49.2) fps 89.0 81.2
DOT3 Bump Mapping 66.6 (57.4) fps 97.3 90.1
Vertex Shader 40.9 (38.3) fps 69.3 86.5
Pixel Shader 40.2 (34.8) fps 81.8 81.7
Advanced Pixel Shader 83.1 (82.7) fps 75.2 74.6
Point Sprites 31.6 (31.5) MSprites/s 31.6 31.6


Atomic CPU Test: тест демонстрирует превосходство целочисленной части K6-III+ над аналогичными блоками Athlon XP-M и Athlon 64. Причиной превосходства является короткий конвейер К6 по сравнению с К7 и К8, а также лучшая производительность блока MMX/3DNow! в К6 над блоком инструкций SSE в К7 и К8, но только в целочисленных вычислениях. Тест FPU расставляет всё по своим местам, от былого 20% преимущества не остаётся и следа, характеристики FPU К7 и К8 оказываются близки по результатам, демонстрируя 1,5-кратное превосходство над К6. Тест взаимодействия кэша/памяти так же показывает, что данные блоки были в К7 и К8 серьёзно переработаны, т.к. разница в показателях не пропорциональна разнице в размерах кэша, объём которого от ядра к ядру удваивается. Производительность подсистемы памяти К7 относительно К6 оказывается на 35% выше, К8 относительно К7 - на 26%. Как далее будет видно, тест хорошо реагирует на изменения в подсистеме памяти, а именно - отключение кэша.

CPU Mathmark не демонстрирует ничего нового, показывая сходные результаты К7 и К8 и их почти 4-кратный отрыв от результатов К6, что является следствием слабости FPU последнего.

Mathmark показывает интересные результаты. Время вычислений оказывается в прямой зависимости от длины конвейера. И К6 здесь лидирует как имеющий самый короткий конвейер в 7 стадий, следующим идёт К7 с конвейером в 10 стадий, и замыкает К8 с конвейером в 12 стадий. Данное явление объясняется тем что все данные, которыми оперирует тест, умещаются во внутренний кэш процессора. Для более детального изучения этого явления ряд тестов были проведены как с влюченным, так и с выключенным кэшем L2 процессора. Как выяснилось, cpu-z не отображает отключение L2 через конфигурационные регистры процессора. В качестве индикатора отключения L2 использовалась программа CBURST32, показывающая ПСП и задержки.


L2 ON
L2 OFF
Atomic CPU Test
Mathmark

Super PI 1M

Как видно из таблицы, кэш L2 имеет определяющее влияние только в 3-х тестах из 6.

Nuclearus MultiCore демонстрирует прямую корреляцию с мощностью FPU.


Super PI - ещё один тест, сильно чувствительный к характеристикам подсистемы памяти. При отключении кэша L2 время расчёта увеличивается вдвое.


Tester v.0.107 показывает зависимость от длины вычислительного конвейера, манипуляции с подсистемой памяти не оказывают на результат никакого влияния.

Xlobuz v.099b3 демонстрирует что результат  в равной степени зависит от мощности сопроцессора и подсистемы памяти. Результаты К7 и К8 оказываются близки между собой и имеют большой отрыв от результата К6.


Кратко подвести итог того что демонстрируют приложенные картинки и цифры в таблицах можно следующим образом: везде, за редким исключением, видно превосходство Socket A над Socket 7 и Socket 939 над Socket A. Объясняется это различиями в микроархитектуре: у K6-III+ ахиллесовой пятой является FPU, там где он заменён на SIMD MMX/3DNow! видно выравнивание результатов, а то и превосходство над соперниками за счёт более короткого конвейера; следующим слабым местом K6-III+ становится L2-кэш, которого в 2 раза меньше по сравнению с Athlon XP и в 4 раза - с Athlon 64 FX-57; затем идёт пропускная способность памяти и системной шины, которая от K6 до К8 поступательно растёт за счёт применения DDR, двухканального доступа и интегрирования контроллера памяти в кристалл процессора. Причём K6-III+ не спасают ни заниженные частоты DDR на более новых системах, ни одноканальный вариант использования памяти, ни даже отключение L2-кэша, ни разгон шиной до 625МГц (5х125), всё равно он проигрывает более новым архитектурам. Тесты 3D Mark хорошо демонстрируют интегральную производительность системы с учётом указанных архитектурных различий.

Подпишитесь на наш канал в Яндекс.Дзен или telegram-канал @overclockers_news - это удобные способы следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал
рейтинг: 4.9 из 5
голосов: 41

Комментарии Правила

Возможно вас заинтересует

Популярные новости

Популярные статьи

Сейчас обсуждают