Phenom II X4 940 — техпроцесс 45 нм, возросшая частота и производительность.
реклама
Первая часть - здесь:
Вторая часть - здесь:
На моей ПС опубликован текст и диаграммы только моего авторства, однако тестовые CPU я в руках не держал, тесты проводились Slayer'oм на расстоянии в несколько тысяч километров от меня.
Phenom II X4 940 — новый технологический процесс, возросшие тактовые частоты, улучшенная производительность.
Не секрет, что основным, фундаментальным свойством известной нам части вселенной, является многовариантность окружающего нас мира. Как только люди открывают тот или иной закон природы, как только им начинает казаться, что они постигли истину, реальная действительность преподносит им сюрприз, опровергая устоявшиеся представления.
Частным случаем динамической многовариантности мира является - закон равновесия. В этом мире все стремится к стабильному равновесию. Нагретое тело неизбежно остывает до температуры окружающей среды, горы с течением времени превращаются в песок, сравниваясь с землей, разность в атмосферном давления больших воздушных масс выравнивается с помощь ветра, холодная зима сменяется теплой весной, а жаркое лето прохладной осенью...
Закон равновесия, как бы ни парадоксально это звучало, применим и к любым человеческим отношениям, вспомните учение Будды о срединном пути, или многочисленные народные пословицы на любых языках мира о «золотой» середине. Как бы ни хотелось многим из нас, чтобы все люди были счастливы, чтобы нас окружала лишь идеальная действительность мир, исходя из фундаментального закона равновесия, обладает и свойством дуализма — то есть наличия двух крайностей одного явления, стремящихся уравновесить друг друга.
Закон равновесия вполне применим и к современному противостоянию двух процессорных гигантов — AMD и Intel, производящих Х86 совместимые CPU. Пик экономического роста одной компании всегда совпадает с падением экономического развития другой. Так было и в эпоху противостояния Intel Pentium III и AMD Athlon, Intel Pentium D и Atlon 64 X2; Core 2 Quad и Phenom. Вероятнее всего, что так будет и дальше, вплоть до изобретения чего-то принципиально нового, способного заменить ПК в его современном виде. Ведь центральные процессоры — это важнейшая часть любого современного компьютера и пока альтернативы им не придумано.
Сегодня, предметом нашего исследования будет, недавно выпущенный компанией Advanced Micro Device, CPU Phenom II X4 940. Речь в этой статье пойдет о некоторых архитектурных особенностях этого ЦП, его производительности в сравнении с доступными нам конкурентами и перспективах ожидающих его на рынке.
В Интернете есть множество статей, посвященных исследованию архитектуры K10, поэтому ее особенности не являются секретом. Однако, для того, чтобы понять суть исследуемого предмета, общее представление о его свойствах иметь следует.
1. Технология SSE-128
В архитектуре K8 параллельно могут выполняться 2 SSE операции, однако в этом CPU блоки SSE лишь 64 битные. Все 128-битные SSE операции K8 обрабатывает как две 64-битных операции.
CPU K-10 (Barcelona) увеличивает разрядность исполнительного блока, который теперь обрабатывает SSE операции, от 64 до 128 бит, соответственно, теперь 128-битные SSE операции не нужно дробить на две 64-битных операции.
Так как для исполнения 128-битных SSE команд, пропускная способность декодирования увеличилась, ядро Barcelona теперь может обрабатывать 32 байта за такт, вместо 16 байтов у K8. От 32 байтной выборки команд выигрывает не только SSE код, но и целочисленные вычисления.
AMD расширила у CPU Barcelona интерфейс между L1 кэшем данных и SSE регистрами. Barcelona может совершить две 128-битных SSE загрузки из L1-D кэша за такт, по сравнению с двумя 64-битными загрузками за такт у K8. Также AMD расширила интерфейс между L2 кэшем и контроллером памяти таким образом, чтобы за такт можно было передавать по 128 бит информации.
2. Предсказатель переходов
В новом CPU AMD Barcelona модернизирован предсказатель переходов. Чем выше число правильно предсказанных команд, тем большее число исполнительных блоков, может быть задействовано в CPU.
В CPU Barcelona добавлен предсказатель непрямых переходов с 512 входами. Непрямая ветка – ветка у которой адресат перехода задается адресом в памяти, то есть переход со многими адресатами. Непрямой переход, вместо того, чтобы направить переход непосредственно к метке, заданной командой перехода, отсылает CPU к ячейке памяти с адресом команды, к которой он должен перейти из этой метки.
Кроме этого у Barcelona – в два раза, в сравнении с K8, увеличен размер стека возврата. В очень длинных цепочках запросов, когда код вызывает много подпрограмм (в частности, рекурсивные функции), CPU может не хватить места для записи начального адреса. Если ЦП потеряет цепочку адресов возврата, он не сможет предсказывать переходы, связанные с этими адресами. Удваивая размер стека возврата, ядро K10 уменьшает вероятность возникновения подобной ситуации.
3. Sideband Stack Optimizer:
У CPU Pentium M компания Intel ввела механизм, названный «dedicated stack manager» – специализированный диспетчер стека. Этот механизм предназначен для работы со стековыми операциями x86 стека (запись в стек, извлечение из стека, запрос, возврат). Задача диспетчера стека состоит в том, чтобы хранить в коде те операции стека, которые часто используются для вызова функций, отделяя их от остальных x-86 команд. Специализированный диспетчер стека занимается декодированием и «исполнением» этих команд, чтобы они не «забивали» декодеры процессора и исполнительные блоки в конвейере.
В Barcelona AMD вводит сходную технологию, которая была названа Sideband Stack Optimizer. Команды стека больше не идут через декодер CPU и стековые операции больше не исполняются через исполнительные блоки, что, по идее, эффективно расширяет CPU Barcelona. Sideband Stack Optimizer, как и dedicated stack manager, имеет собственный сумматор, обрабатывающий все операции стека.
4. Более быстрая (внеочередная) загрузка:
Одним из основных преимуществ микроархитектуры Core является возможность разрешать командам загрузки обходить предыдущие команды загрузки и выгрузки. В среднем около трети всех команд программного кода заканчивается их загрузкой, соответственно, если вы можете увеличить скорость их загрузки, то можете увеличить скорость работы приложения. В микроархитектуре Core можно изменить последовательность загрузок, команды, зависящие от этих загрузок, получат нужные им данные.
У архитектуры CPU - K8 подобной схемы не было, поэтому даже без интегрированного на кристалле контроллера памяти CPU Core 2 Duo Intel может выполнять некоторые операции с памятью быстрее, чем K8. В Barcelona эта проблема решена вводом аналогичной схемы «быстрой загрузки».
Теперь и CPU Barcelona может менять очередность и ставить одни загрузки перед другими, загрузка может выполняться перед выгрузками, при условии, что процессор «знает», что обе эти операции не используют один и тот же адрес памяти. Если Intel для определения конфликта выгрузки и загрузки использует предсказатель, то у AMD Barcelona ждет, пока адрес выгрузки не будет вычислен. Работая по такой схеме, Barcelona никогда не ошибается, а значит не может получить сброс всего конвейера. Новый CPU AMD может вычислить до трех адресов выгрузки за такт, у него имеется 3 блока расчета адресов (AGU - Address Generation Unit), по сравнению с одним блоком на выгрузку у Intel, это значит, что у AMD больше вычислительных мощностей для вычисления адреса выгрузки ещё до того, как поставить загрузку перед выгрузкой.
5. Буфер TLB:
Для кэширования карты виртуальных адресов распределения физической памяти системы используются буферы трансляции-просмотра (Translation Lookaside Buffer - TLB). Частота успешных обращений к TLB весьма высокая, но, однако, так как программы становятся все больше и требуют всё больше памяти, приходится подгонять под них и объемы TLB. Соответственно если у K8 TLB больше, чем у K7, то у CPU Barcelona AMD TLB больше чем в K8.
TLB у Barcelona поддерживают 1G страницы, которые нужны для баз данных и виртуализации нагрузки. В этом CPU AMD сделала 128 входов 2M L2 TLB, что помогает при работе с новыми программами, для которых нужны большие «страничные» (page) файлы. Усовершенствования TLB у Barcelona заметны в корпоративном использовании в серверных приложениях, для которых нужны большие объемы памяти.
6. Деление целых чисел:
Выпуская свой второй Pentium M, под кодовым названием Dothan, Intel одним из улучшений сделала меньшую задержку при делении целых чисел. AMD заявляет, что у Barcelona аналогичная задержка также уменьшена.
AMD в CPU Barcelona перевела несколько команд в микрокоды и сделала их fastpath-инструкциями. Такие команды могут пройти через fastpath-декодер ядра значительно быстрее, чем происходит декодирование обычных микрокоманд. Команды CALL и RET-Imm теперь являются fastpath-командами, что является частью улучшения оптимизации байпасного стека (sideband stack optimization) в Barcelona. Команды MOV из SSE регистров в целочисленные регистры теперь также являются fastpath-командами.
Кроме того в Barcelona AMD ввела несколько новых расширений для своей технологии ISA. Так, в частности введены две новых команды для работы с битами: LZCNT и POPCNT. Leading Zero Count (LZCNT) считает число первых нулей операции, а Pop Count считает количество всех единиц. Обе эти команды предназначаются для приложений шифрования.
(POPCNT (Population Count) - это число единичных битов (не обязательно первых). Используется в криптографии при реализации РСЛОС (регистр с линейной обратной связью) и некоторых других алгоритмов. Так, для аргумента 0011000010101101 POPCNT вернет 7, так как в нем 7 единиц).
7. Новые SSE инструкции:
AMD ввела и 4 новых SSE расширения: EXTRQ/INSERTQ, MOVNTSD/MOVNTSS. Первые два расширения – это маскирование и сдвиг, объединенные в одну команду, две последние – скалярная потоковая выгрузка (потоковая выгрузка, которая может быть применена к скалярным операндам).
8. Более быстрый контроллер памяти:
У архитектуры Intel - FB-DIMM, используемой в серверах Xeon, является возможность одновременной записи и чтения в буфер/из буфера. С обычной памятью DDR2 можно делать либо запись, либо чтение, что заставляет терять темп при переключении с одной операции на другую. Если эти события происходят случайным образом, на это тратится достаточно много времени, чего бы не было, если бы сначала выполнялись все операции чтения, а после переключения – запись. Контроллер памяти в CPU K8 старается сначала произвести чтение, (на это нужно меньше времени), у ядра K10 контроллер памяти усовершенствован. Вместо того чтобы произвести запись сразу же по приходу этой команды, они записываются в буфер, и как только буфер заполнится до заданного порога, контроллер выполнит подряд все эти операции. Таким образом, сокращаются задержки на переключение чтение/запись, что помогает увеличить пропускную способность и уменьшить задержки.
У ядра K8 в кристалле один контроллер памяти с 128 битной шиной, а у CPU Barcelona AMD разделила контроллер DRAM на два отдельных 64-битных контроллера. Каждым контроллером можно управлять независимо, поэтому мы получаем некоторое увеличение быстродействия, особенно при задействовании 4 ядер, когда каждое ядро работает со своим потоком данных и своим массивом ячеек памяти.
Северный мост Barcelona сделан таким образом, чтобы обеспечивать более высокую пропускную способность, чем раньше. У него более объемные буферы, что позволяет поддерживать более высокую пропускную способность, и северный мост уже подготовлен для работы с будущими технологиями памяти (например, DDR3).
9. Новый блок предвыборки:
Известно, что ядро K8 имеет 2 блока предвыборки на ядро – один для команд, и один для данных. Ядро Barcelona имеет тоже два блока предвыборки, но они улучшены. Самое радикальное изменение в том, что блок предвыборки данных теперь переносит данные прямо в L1 кэш данных, а не в L2 кэш, как у K8. AMD также увеличила гибкость своего блока предвыборки команд L1 кэша, чтобы он мог обрабатывать 2 предстоящих запроса по любому адресу.
Каждое ядро Barcelona имеет свой набор блоков предвыборки команд, но главное его усовершенствование в том, что теперь у него есть новый блок предвыборки – блок предвыборки DRAM. Данный блок расположен в контроллере памяти, он просматривает все запросы к памяти и старается извлечь из неё данные, которые, по его мнению, понадобятся в будущем. Так как этот блок предвыборки помогает всем четырем ядрам по отдельности, то он помогает всему CPU улучшить производительность, и может эффективно намечать тенденции, которые будут положительно влиять на работу всех ядер. Блок предвыборки DRAM не переносит данные ни в L2, ни в L3 кэш CPU – у него есть собственный буфер, поэтому он не «засоряет» кэши. У этого буфера примерно 20 - 30 строк кэша и он может быть тем же самым буфером, который использует Barcelona для накопления записей, о котором говорилось выше.
10. Особенности КЭШа третьего уровня:
В настоящее время у двух ядер CPU Core 2 Duo 4 МБ общего L2 кэша, в то время как у самого быстрого процессора AMD на ядре K8 он в 2 раза меньше. Это «отставание» продолжится и в новом CPU Barcelona, (напомню, что каждое из его четырех ядер будет иметь только 512 Kb L2 кэш, что в сумме дает 2 Mb в то время, как у четырехъядерного CPU Intel Kentsfield в уже сейчас имеется 8 МБ L2 кэш на 4 ядра).
Разместив 4 ядра на одном кристалле, AMD оставив иерархию кэшей K8, добавила третий уровень кэша – общий для всех четырех ядер. Сделанный по 65 нм технологии, четырехъядерный Barcelona будет иметь 2 МБ L3 кэш, доступный для всех четырех ядер, который может быть впоследствии увеличен (впрочем об этом уже говорилось).
Иерархия кэшей в Barcelona работает следующим образом: сначала L2 кэши заполняются излишками L1 кэшей. Когда кэш полностью заполняется, часть данных, которые не использовались в последнее время, освобождают место для новых данных, а эти данные переписываются в L2 кэш (кэш второго уровня).
Новый кэш L3 в CPU K10 работает как общий кэш для всех L2 кэшей четырех ядер. Алгоритмы, управляющие работой L3 кэша, стараются сохранять в нем данные, которые могут понадобиться нескольким ядрам. Если CPU сделает выборку кода, его копия останется в L3 кэше, чтобы этот код был доступен всем четырем ядрам, однако простая загрузка данных осуществляется независимо. Контроллер кэш-памяти следит за хронологией, и если данные уже есть в общем доступе, их копия остается в L3 кэше; если нет – они сохраняются.
У L1 и L2 кэшей ассоциативность не изменена – 2 и 16 уровней соответственно. Однако у нового L3 кэша уровень ассоциативности 32. Это должно повысить число успешных обращений к относительно маленькому, по сравнению с его конкурентами, кэшу.
11. Улучшение технологии виртуализации:
У CPU Barcelona увеличена скорость переадресации адресов виртуализации. В виртуальном программном стеке, где гипервизор управляет несколькими гостевыми ОС, трансляция адресов памяти происходит по-новому, поэтому нужно производить переадресацию от гостевой ОС к гипервизору, ведь у каждой гостевой ОС свой собственный диспетчер памяти. По мнению AMD, в настоящее время этот новый уровень переадресации осуществляется программно методом shadow paging. В качестве альтернативы shadow paging Barcelona предлагает Nested Paging – свою технологию с аппаратным ускорением.
Предположительно, что до 75% времени гипервизор может работать с теневыми страницами, которые AMD ликвидирует, научив процессор работать как с гостевыми таблицами страниц, так и с хостовыми. Транслируемые адреса кэшируются в новом большем буфере TLB (о котором уже говорилось выше), что ещё больше увеличивает производительность. Чтобы включить поддержку Nested Paging у Barcelona, достаточно установить соответствующий бит режима, что разработчики ПО могут легко осуществить.
1. Новые Phenom II X4 выпускаются по технологии 45 нм, имеют площадь ядра 258 кв. мм и содержат 758 млн. транзисторов, Phenom X4 предыдущего поколения, выпускаемые по 65-нм технологии, обладают 450 млн. транзисторов при площади ядра 285 кв. мм. Новые CPU AMD созданные на основе архитектуры Stars решили проблему с недостаточно высокими тактовыми частотами, из-за которых Phenom не могли на равных конкурировать с Core 2 Quad. Сегодня старшим CPU Phenom II, появившимся в продаже является AMD Phenom II X4 940 с штатной тактовой частотой 3,0 Ггц.
2. В CPU Phenom II X4 на новом ядре Deneb втрое (с 2-х Мб до 6-ти Мб) возрос объем кеша 3-го уровня, что позволяет более эффективно задействовать исполнительные блоки ЦП. Максимальный прирост увеличение объема кеша 3-го уровня должно дать в «кешелюбивых» игровых приложениях. Так ли это станет понятно по результатам тестирования нового ЦП.
3. Кроме увеличения объёма, кэш-память новых CPU производства AMD стала быстрее, чем у оригинальных Phenom. Её латентность уменьшилась на 2 цикла, однако, при этом в полтора раза увеличилась ассоциативность. L3-кэш процессоров Phenom II X4 имеет 48 областей ассоциативности, в то время как у Phenom X4 он делился на 32 области.
К сожалению, пока (?!) переход на новый технологический процесс не позволил AMD увеличить тактовую частоту встроенного в ядро CPU северного моста, в Phenom II X4 он работает на 1,8 Ггц, что даже ниже, чем в серийно выпускаемых Phenom Х4 BE (индексы моделей - 9850, 9950). Исходя из здравого смысла, увеличение тактовой частоты северного моста новых ЦП увеличило бы и производительность кеша третьего уровня, а соответственно и производительность CPU в целом, но пока мы этого не видим.
Впрочем, по моему скромному мнению, относительно низкая тактовая частота северного моста — это вынужденная мера, вызванная необходимостью добиться прироста производительности CPU Phenom II при смене платформы с сокетом AM2+ на платформу с гнездом АМ3. Вероятнее всего, в ЦП, для гнезда AM3, тактовая частота северного моста будет выше - в пределах 2-2,2 Ггц.
4. В 45-нм CPU AMD улучшена работа алгоритмов предсказания переходов: теперь эти процессоры могут предсказывать косвенные переходы, как это уже реализовано в ЦП основного конкурента. В новом ядре инженеры компании производителя увеличили объемы внутренних буферов загрузки и сохранения данных, буферов FPU.
Одним из дополнительных улучшений в новых ЦП AMD является ускорение работы инструкции перемещения значения с плавающей точкой между регистрами процессора. Кроме того в CPU на ядре Deneb введена конвейеризация инструкций с префиксом LOCK, ускорение работы алгоритма поддержания когерентности кэшей при межъядерном обмене данными.
5. Технология Cool'n'Quiet 3.0 впервые появившаяся в CPU AMD Phenom II X4 (ранее, в ЦП AMD Phenom II имела место предыдущая версия технологии энергосбережения - Cool'n'Quiet 2.0). По заявлениям AMD, новая версия технологии энергосбережения на 50% эффективнее нежели предыдущая версия Cool'n'Quiet 2.0.
Основные характеристики ЦП AMD Phenom II в равнении с характеристиками CPU Phenom представлены в таблице ниже:
Источники:
первый;
[url= http://www.fcenter.ru/online.shtml?articles/hardware/processors/25857]второй[/url];
третий.
2. Краткий обзор и результаты тестирования CPU AMD Phenom II X4 940
В лабораторию сайта www.AMDClub.ru тестовый CPU попал прямиком из представительства AMD. Учитывая то, что ЦП этот посетил уже не одну тестовую лабораторию, к нам этот он попал без упаковки, в комплекте с CPU был боксовый кулер от ЦП Phenom X4 9950. Внешний вид CPU AMD Phenom II X4 мало чем отличается от ЦП AMD Phenom, те же размеры, та же теплораспределительная крышка, то же самое гнездо AM-2+. CPU имеет следующую маркировку: HDZ940XCJ4DGI и изготовлен на 43 неделе 2008 г.
Утилита CPU-Z сообщила об AMD Phenom II X4 следующую информацию:
Тестирование ЦП проводилось по методике сайта AMDClub.ru, сравнивался CPU AMD Phenom II X4 940 с «народным» четырехъядерником от Intel — Core 2 Quad 6600, разогнанным до тактовой частоты 3,0 Ггц.
Для CPU AMD Socket AM2+:
CPU: AMD Phenom II X4 940;
CPU Cooler: Box (От 9950 Phenom'а);
Thermal Paste: Алсил-3;
MB: Asus M3A-H HDMI (780G+SB700) биос 1301;
RAM: 2x2Gb DDR2-800 Kingston;
Video: 640Mb MSI NX8800GTS-T2D640E-HD (648-2000)
Sound: Internal;
HDD: ST31500341AS 3x1500Gb RAID1, RAID1, RAID5
Case: Chieftec CA-01B-B-SL
PSU: GPS-500AB-A (500W)
UPS: IPPON Smart Power Pro 1000
Monitor: 24" BENQ G2400WD
OS: Windows Vista Home Premium Rus SP1 x64
Для CPU Intel LGA775:
CPU: Intel Core 2 Quad Q6600@(3,0GHz)
CPU Cooler: Thermalright SI-128 + Thermaltake A1927
Thermal Paste: Liquid Pro (ЖМ)
MB: ASUS P5K Pro (P35+ICH9R) биос 1002
RAM: 4x1Gb DDR2-1066 OCZ
Video: 640Mb MSI NX8800GTS-T2D640E-HD (648-2000)
Sound: Audigy2
HDD: HDP725050GLA360 500Gb, HDT725025VLA380 250Gb
Case: Thermaltake Mozart TX VE1000BNS
PSU: Thermaltake Toughpower W0116RE (750W)
UPS: IPPON Smart Power Pro 2000
Monitor: 20.1" BENQ FP2091
OS: Windows Vista Home Premium Rus SP1 x32
В целях исследования влияния тактовой частоты встроенного северного моста CPU на производительность и возросшей тактовой частоты оперативной памяти, которое, думаю будет интересным многим читателям, тестовый CPU AMD Phenom II X4 940, работающий на штатной тактовой частоте (3 ГГц) тестировался в двух режимах:
Стандартный 200х15 (CPU NB-1800 МГц) и режим «разгона по шине» 240х12.5 (CPU NB-1920 МГц). Оперативная память DDR-800 разгонялась синхронно с CPU и работала на тактовой частоте 480(960) МГц с таймингами 5-5-5-18-24 2T.
CPU Intel Core 2 Quad Q6600@(3,0GHz) работал в следующем режиме:
Первоначально планировалось тестировать Phenom II в режиме 250х12, то есть так же, как был разогнан его оппонент - CPU Intel Core 2 Quad Q6600, но ввиду, пока не выясненной ошибки в BIOS тестовой материнской платы, ПК зависал при старте, выдавая при таких параметрах тактовую частоту CPU, как 3.75 ГГц. Причина ошибки выясняется, вероятнее всего, ее истоки будут обнародованы в следующих статьях.
Невооруженным взглядом видно, что тестовые стенды, отличаются друг от друга больше, чем кажется на первый взгляд. Без учета разности уровня тестовых материнских плат, видно, что в платформе Intel LGA 775 используется более быстрая оперативная память, однако в противовес этому, в платформе AMD Socket AM2+ в качестве дисковой подсистемы HDD организован RAID. С другой стороны, если в платформе AMD используется встроенный звуковой адаптер, то в платформе Intel — игровая звуковая карта Audigy 2... Таким образом, следует отметить что преимущество одной платформы по определенному параметру нивелируется отставанием в другом. В целом, с учетом возможных погрешностей, две тестовые платформы вполне пригодны для сравнения.
Поскольку нас интересует производительность CPU, а не других компонентов тестовых ПК, а сходные по уровню комплектующих ПК достаточно распространены среди обычных владельцев ПК, думаю, нам пора переходить к тестам.
Откровенно говоря, в настоящее время, ценность результатов вычислений в программе Super Pi стремится к нулю, хотя бы потому, что на вычисление числа Пи с точностью до 1-го миллиона знаков после запятой, на среднем ПК осуществляется меньше минуты, да и кому нужна такая точность, если в вычислениях, как правило число Пи считают равным 3,14. Тем не менее, использование программы для вычисления числа Пи в качестве теста производительности CPU, в какой-то мере оправдано. Хотя бы потому, что это весьма популярно. Результаты тестов Вы можете видеть на диаграмме ниже:
В этом тесте мы наблюдаем закономерное отставание центрального процессора AMD от своего противника из стана Intel. Не секрет, что вычислительные блоки ядер ЦП Intel архитектуры Core 2 Duo обладают более высокой производительностью, нежели аналогичные блоки в ядрах CPU процессорной архитектуры AMD K8 и архитектуры K10 (Stars). В данном случае нам лишь остается констатировать факт, что в тесте SuperPi современным процессорам Intel пока нет равных. Лучший из ЦП АМД, работающий на тактовой частоте 3 ГГц отстает от своего оппонента, разогнанного до такой же тактовой частоты на весомые 26 %, ситуация несколько улучшается, при использовании ЦП в режиме «разгона по шине», отставание сокращается до ~ 23%, но оно все равно очень велико. Сохранится ли статус кво в тесте SuperPi в будущем в будущих CPU этих двух конкурентов на грядущей архитектуре? Время покажет...
К сожалению, данный бенчмарк не пользуется особой популярностью, хотя его результаты, в части измерения производительности ЦП выглядят вполне адекватно. На диаграмме представлены итоговые результаты производительности ALU и FPU тестовых CPU.
Итак, тенденция к отставанию CPU Phenom II X4 940 от CPU Intel Core 2 Quad 6600, разогнанного до 3,0 ГГц, наметившаяся в первом синтетическом тесте SuperPi продолжена, хотя и в гораздо меньшей степени. В процентном отношении новый четырехъядерный ЦП AMD в тесте ALU отстает от Core 2 Quad 6600 на 8%, а в тесте FPU на 12%. Таким образом можно констатировать, что отставание процессора AMD есть, но оно не столь велико, чтобы назвать результат разгромным.
«Разгон по шине» тестового CPU AMD в этом тесте видимой пользы не приносит, налицо даже некоторое снижение результатов, правда в пределах погрешности измерений...
В качестве следующего синтетического бенчмарка нами использовалась утилита SiSoftware Sandra Lite 2009 SP2. Следует отметить, что в настоящее время эта утилита утратила былые позиции, что связано отчасти с излишней «рафинированностью» тестового пакета, а отчасти с с сомнительной достоверностью результатов.
Как видно из диаграммы, здесь борьба между тестовыми центральными процессорами идет с переменным успехом. Если в арифметическом тесте первенство с разницей почти 10% принадлежит Core 2 Quad 6600, то в мультимедийном все наоборот - AMD Phenom II X4 940 обходит конкурента на весомые 26,5%. Разгромным выглядит результат ЦП AMD в тесте на многоядерную эффективность — отставание почти четырехкратное, однако у меня лично большие сомнения в адекватности результатов этого теста, ведь не секрет, что в реальных многопоточных приложениях масштабируемость Phenom'ов ничуть не хуже (если не лучше), чем у аналогичных ЦП Intel (исключение, быть может, новейшие Core i7). В криптографическом тесте первенство вновь принадлежит AMD, разница в его пользу — 8%.
При работе CPU AMD Phenom II X4 940@3,0 ГГц в режиме 240х12.5 результаты изменяются в пределах погрешности, за исключением теста многоядерной эффективности. Впрочем о своих сомнениях в объективности данного теста я говорил выше.
Резюмируя результаты синтетического бенчмарка SiSoftware Sandra Lite 2009 SP2, следует отметить, что новый топ от AMD в синтетических тестах выглядит достойно, жаль что они не в полной мере отражают действительное положение дел...
Одним из бенчмарков, предусмотренных методикой сайта AMDClub.ru является тестирование производительности CPU встроенными средствами графического синтетического теста 3DMark 06. Учитывая высокую процессорозависимость этого тестового пакета, следует отметить, что он вполне адекватно отражает производительность CPU. Насколько хорошо смог себя показать CPU AMD Phenom II X4 940 в этом приложении видно на диаграмме.
Итак, в целом в процессорном тесте 3DMark 06 фиксируется пусть и небольшое, но отставание CPU AMD Phenom II X4 940 от Core 2 Quad 6600@3 ГГц. Наименьший результат показывает CPU Phenom II при работе в штатном режиме, при «разгоне по шине» тестового CPU растет и количество «марков» набранных им в тесте. В любом случае, на диаграмме прекрасно видно, что примерно 4,6 процентное отставание CPU AMD от CPU Intel далеко не критично.
Впрочем, насколько же AMD Phenom II X4 940 хорош (или плох) в реальных приложениях, покажут следующие тесты, а пока, тем кто не любит всматриваться в диаграммы, я предлагаю изучить сводную таблицу с результатами синтетических тестов.
Методика тестирования центральных процессоров, предусматривает также и использование встроенного в ОС Vista бенчмарка, естественно, что он был и использован, однако в нем оба CPU ( и AMD Phenom II X4 940 и Intel Core 2 Quad 6600@3,0 ГГц) показали максимально достижимый результат в 5,9 баллов. При таких результатах делать диаграмму и заносить данные в сводную таблицу, по мнению автора, не имеет смысла.
В качестве тестового пакета, при оценке производительности центральных процессоров при обработке растровых изображений нами использовался бенчмарк, созданный поклонниками утилиты для обработки изображений Paint.NET. Следует отметить, что тест этот обладает определенной ценностью еще и потому, что платформа NET от Microsoft кроссплатформенна, а значит его результаты можно экстраполировать и на другие ОС. В этом тесте меньший результат — лучший результат, время завершения бенчмарка на диаграмме указано в милисекундах.
А вот и первые результаты в реальном приложении. И результаты эти в пользу AMD Phenom II X4 940, который обошел Intel Core 2 Quad 6600@3,0 ГГц почти на 10%. Естественно, что экстраполировать результаты одного бенчмарка на все программные пакеты для обработки фотографий не стоит, но как минимум, можно констатировать тот факт, что для работы с растровыми изображениями новый CPU от AMD вполне пригоден и показывает неплохую производительность. «Разгон по шине» AMD Phenom II X4 940 приносит пусть немного, но все же лучший результат, чем при его работе в стандартном режиме.
В этой подгруппе тестов для определения уровня производительности CPU нами используются две наиболее распространенные программы-архиватора — RAR и 7Zip. Изучать производительность тестовых центральных процессоров мы начнем с реального теста на архивирование тестового набора файлов. Время в диаграмме указано в секундах, меньше, значит лучше.
Как видите, в этой подгруппе тестов отставание AMD Phenom II X4 940, работающем в стандартном режиме, от Intel Core 2 Quad 6600@3,0 ГГц, хотя и имеет место, но оно не столь значительно, чтобы говорить о явном преимуществе одного ЦП над другим. Впрочем, Вы можете думать по другому, так как в процентном отношении отставание целых 9 % в RAR и 3,6% в 7Zip.
При разгоне CPU AMD Phenom II X4 940 «по шине», ситуация резко меняется — отставание в RAR сокращается до ~ 5%, а в 7Zip он и вовсе вырывается вперед, обгоняя своего противника на целых 4,5 %.
Как известно, программы для сжатия данных положительно относятся к скорости подсистемы памяти ПК, что весьма наглядно и проявляется в данном тесте. Более быстрая оперативная память дает CPU Intel преимущество, которое куда-то исчезает при сравнении с «разогнанным по шине» Phenom II, при условии, что RAM разгоняется синхронно с ЦП.
Теперь пришла очередь синтетической части этой подгруппы тестов, использовались встроенные в тестовые программы RAR и 7Zip бенчмарки. Результаты Вы можете видеть на диаграмме. Больше — значит лучше. Баллы в 7Zip и RAR - количество Кб\сек.
Как говорится, синтетика она хоть и в Африке синтетика. В этом тесте налицо преимущество AMD Phenom II X4 940 над Intel Core 2 Quad 6600@3,0 ГГц. Жаль, конечно в тестах на сжатие данных результаты были несколько иными, но синтетические тесты предназначены для того, чтобы моделировать идеальные условия. В данном случае, результаты синтетических тестов, не противоречат реальной действительности.
В данной подгруппе тестов, для кодирования аудиофайлов, нами использовалась программа Bpoweramp Music Converter, кодировался WAV-файл альбома группы Orlik, объемом 494Мб, в качестве конечного формата нами выбраны распространенный MP3 и не менее качественный, но абсолютно свободный от ограничений, связанных с авторскими правами OGG Vorbis. Настройки кодеков выставлены на максимальное качество. Результаты тестов на диаграмме, меньше — значит лучше, результаты указаны в секундах.
Традиционно хорошо показывают себя CPU производства Intel в работе с аудиоконтентом. Не исключением стали и результаты нашего тестирования. Я бы мог сказать, что AMD Phenom II X4 940 с треском проиграл Intel Core 2 Quad 6600@3,0 ГГц, но на самом деле в абсолютных значениях разница между тестовыми CPU не столь велика, чтобы делать столь громкие заявления, хотя и весьма чувствительна. Как ни крути, но 26% проигрыша в Lame и почти 15% в OGG vorbis, при работе в штатном режиме - это много.
При работе AMD Phenom II X4 940 в режиме 240Х12,5 значительно улучшается ситуация при использовании для кодирования аудиоконтента кодека Lame, отставание Phenom'а сокращается до 14%, а вот OGG vorbis к «разгону по шине» абсолютно равнодушен.
Впрочем, если посмотреть на количество реально затраченного времени, то в абсолютных числах разница не столь уж и велика: 40 секунд отставания AMD Phenom II X4 940 работающего в штатном режиме от своего конкурента из стана Intel при кодировании полугигабайтного аудиофайла в формат MP3, при нечастом использовании ПК у себя дома для этих целей - «погоды» не сделают...
В качестве тестового пакета при кодировании видеоконтента использовался конвертер, идущий в комплекте с кодеком DivX Codec 7. Суть тестирования сводится к кодированию тестового AVI-файла (157Мб) в формат HD1080p при настройках кодека DivX по умолчанию. Меньше — лучше, результаты теста Вы можете видеть на диаграмме.
Если при кодировании аудио AMD Phenom II X4 940 существенно проиграл Intel Core 2 Quad 6600@3,0 Ггц, то при обработке видеоконтента ситуация прямо противоположна. Не исключено, конечно что в других приложениях ситуация будет другой, но в кодеке DivX новый CPU AMD, мягко говоря, ощутимо переиграл Core 2 Quad 6600@3,0 Ггц. По крайней мере 15% превосходства на одной тактовой частоте, при работе в режиме 200х15 и 20% выигрыша в режиме 240х12,5 в этом, достаточно тяжелом для ЦП тесте является высоким результатом.
В качестве игровых приложений методика сайта AMDClub.ru предусматривает использование следующих игр для ПК:
- Чистое Небо (STALKER : Clear Sky 1.0);
- FAR CRY 2 (1.02);
- Company of Heroes (1.71);
- SUPREME COMMANDER (1.1.3280).
Тестирование центральных процессоров осуществляется при минимальных настройках, при разрешении экрана 640х480 либо 800х600 точек, конкретные настройки указаны в диаграммах, либо при описании тестовой игры. Дабы сразу же отклонить возможные претензии читателей о том, что дескать, никто при таких настройках в игры давно не играет, и зачем нам тесты «сферического коня в вакууме», сообщаю — таково волевое решение автора методики тестирования ЦП. Он считает, что при тестировании CPU важно знать на что он способен при минимальных графических настройках и минимальном разрешении, не ограничивающем его возможности. При повышении уровня графических настроек и разрешения экрана, разница между разными CPU нивелируется, а значит и тестирование теряет смысл.
В играх тестовый CPU AMD Phenom II X4 940 работал в стандартном режиме 200х15. Волевым решением администратора сайта AMDClub.ru было принято решение не тестировать CPU при разгоне по шине в играх. Почему, спросите Вы? Потому что всем, кто внимательно читал статью и смотрел диаграммы, должно быть понятно, что прирост от «разгона по шине» если и будет, то далеко не во всех играх, а лишь в тех, которые критичны к скорости подсистемы памяти (то есть во всех, ухмыльнетесь, Вы). Возможно, что Ваше предположение верно и это именно так, в других статьях мы исследуем этот вопрос более подробно.
Жанр: шутер
Используется специальная версия "S.T.A.L.K.E.R.: Чистое Небо", созданная для тестирования и оценки производительности системы. В основу бенчмарка положена игровая локация (Болота), тестирование проходит в 4 этапа, с использованием различных погодных и временных настроек (день, ночь, яркое солнце, дождь). Фиксируются результаты, выводимые самим бенчмарком. При тестировании использовались следующие настройки:
- установки графики — минимум;
- рендер — статическое освещение;
- видеорежим 800х600
Если Вы внимательно смотрели на диаграмму, то могли заметить, что если исходить из минимального уровня FPS, важнейшего параметра для игр жанра «шутер», то в целом мы наблюдаем паритет тестовых CPU (нулевой результат CPU Intel в одном из подтестов, скорее всего «глюк» самого бенчмарка). Говоря же о среднем и максимальном уровне FPS в этом тесте, следует отметить преимущество CPU AMD. Помните, в начале статьи, я предполагал, что увеличение кеша 3-го уровня более всего будет заметно в играх. Пока мои предположения верны, но что будет дальше?!
Жанр: шутер
Используется встроенный бенчмарк. Фиксируется минимальное, среднее и максимальное количество кадров в секунду. Настройки графики минимальны, разрешение 640х480 точек.
А в этой игре CPU AMD Phenom II X4 940 довольно ощутимо проиграл Intel Core 2 Quad 6600@3,0 Ггц. В процентном отношении проигрыш равен от 11% по уровню минимального FPS до 20% по уровню максимального. Впрочем, если смотреть на абсолютные цифры, то производительности обоих CPU для этой игры хватит с избытком.
Жанр: стратегия реального времени
Используется встроенный бенчмарк, настройки графики минимальные. Поскольку бенчмарк - видео ролик, то фиксируется одна характеристика - минимальное количество кадров в секунду.
В этой диаграмме, с весомым отрывом вырывается вперед CPU AMD Phenom II X4 940. Более того, выигрыш достаточно велик — почти 6 %. Хотя, опять же в абсолютных цифрах «на глаз» разницу между 55 и 50 FPS в игре, вы скорее всего не заметите, так как уровень FPS позволяет вполне комфортно играть в эту игру.
Жанр: стратегия реального времени
Используется встроенный бенчмарк, настройки графики по умолчанию. Запускается тест: c:\Program Files\THQ\Gas Powered Games\Supreme Commander\bin\SupremeCommander.exe" /map PerfTest Оценивается итоговая числовая оценка теста.
В этой игре мы вновь видим, пусть и не значительный, но все же выигрыш CPU AMD над CPU Intel. Если бы AMD удалось выпустить такой ЦП, пусть даже на более низкой тактовой частоте хотя бы год назад, то ситуация на рынке выглядела бы немного по другому. Впрочем для AMD еще не все потеряно, кризис не вечен, а при адекватном уровне цен эти CPU будут весьма и весьма востребованы.
Вообще, если говорить о результатах CPU AMD Phenom II X4 940 в игровых тестах в целом, то процессор показал себя очень неплохо. По крайней мере, мы видим выигрыш в трех играх из четырех, а значит позиции CPU Intel архитектуры Core 2 Duo, как безальтернативного выбора для среднебюджетной игровой системы ушли в прошлое. Да здравствует конкуренция!
Итак, по результатам тестирования AMD Phenom II X4 940 в сравнении с Intel Core 2 Quad 6600@3,0 Ггц, хочется отметить следующее:
Проведенное нами тестирование показало сильные и слабые стороны нового CPU AMD. Как и любой продукт человеческой мысли ЦП AMD Phenom II X4 940 имеет как достоинства, так и недостатки. К недостаткам этого CPU следует отнести некоторое отставание в производительности от аналогичных CPU Intel, оно пусть теперь и не столь значительное, каким было отставание Athlon 64 X2 от CPU Intel Core 2 Duo, во времена их выхода, но тем не менее в некоторых тестах оно имеет место.
Впрочем, не все так плохо, как кажется. Новый ЦП AMD имеет и неоспоримые достоинства, ведь на самом деле, отставание AMD Phenom II X4 940 от Intel Core 2 Quad 6600@3,0 Ггц, заметно лишь в некоторых синтетических тестах и в части приложений, где CPU Intel традиционно показывали отличные результаты, например в кодировании аудиоконтента.
В других приложениях — таких как архиваторы, игры, обработка фотографий и даже в кодировании видеоконтента AMD Phenom II X4 940 не только не отстает от своего конкурента, но иногда даже и выигрывает, причем не на какие-то 2-3%, его преимущество над Intel Core 2 Quad 6600@3,0 ГГц достигает 10% и даже 20%, что не может не радовать поклонников продукции AMD.
Свое возрождение Advanced Micro Device в ушедшем 2008 году начала с важных побед над конкурентами в сегменте высокопроизводительных дискретных видеокарт, затем продолжила, выпустив конкурентноспособную мобильную платформу, а теперь компания представила миру и CPU достойной производительности.
К сожалению, выше головы не прыгнешь, так как вычислительная мощь ядер K10 все же ниже, чем у ядер CPU архитектуры Core 2 Duo и Core i7 компании Intel, но проведенная AMD «работа над ошибками» по мнению автора, свидетельствует о том, что эта компания способна «довести до ума» даже не самый удачный из своих продуктов, сделав его весьма и весьма привлекательным для потребителя.
Итак, тестирование завершено, CPU AMD, полученные из представительства этой компании в России скоро будут возвращены законным владельцам. Естественно, что мы не последний раз изучали особенности продукции этой компании, впереди нас ждут и новые видеокарты, и новые CPU, и другая продукция этого производителя.
Протестированный нами центральный процессор AMD Phenom II X4 940 оставил у нас самые приятные впечатления, а его выпуск внушает уверенность в том, что застой в «процессоростроении» наконец то сменился периодом динамического развития и нам следует ожидать нового витка извечного противостояния AMD и Intel.
В заключение моей статьи, хочу отметить, что не смотря на длительную «полосу неудач», преследовавшую компанию AMD с момента выхода на рынок CPU Intel архитектуры Core 2 Duo, не смотря на убытки, длящиеся уже несколько лет подряд, AMD наконец то удалось создать конкурентоспособный десктопный центральный процессор, достойный оказаться в системном блоке не только поклонника продукции этой компании, но даже и ее ярого противника, хотя бы для того, чтобы он мог лично убедиться в том, что теперь «четырехъядерники» от AMD ничуть не хуже, а в чем-то даже и лучше «четырехъядерников» от Intel.
C уважением, Freevad.
P.S. Огромное спасибо команде сайта AMDClub.ru и лично администратору сайта Slayer'y за возможность написать данную статью, так как до наших краев новые CPU AMD пока не дошли.
Обсудить можно здесь:
реклама
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Сейчас обсуждают