Core 2 Quad Q6600 16 лет спустя
Введение
Многим из читателей, возможно, будет в это трудно поверить, но первые 4-ядерные x86-64 процессоры для настольных систем были представлены более 16 лет тому назад, в ноябре 2006 года, когда компания Intel явила миру свой очередной "экстремальный" процессор, Core 2 Extreme QX6700.
реклама
Первый 4-ядерный x86-64 процессор для домашних пользователей представлял собой два 2-ядерных кристалла, объединённых на одной подложке. Intel попросту повторила уже использованный ранее в процессорах Pentium D подход, удвоив количество ядер простым объединением двух кристаллов в одном корпусе. Преимущества и недостатки такого дизайна были и остаются очевидными: с одной стороны компании не нужно было тратить время и ресурсы на разработку нового 4-ядерного кристалла, с другой — ядрам из разных кристаллов для обмена данными необходимо было пересылать последние через северный мост по FSB.
Конечно же, последнее обстоятельство сказывалось на производительности, но на практике потери были не столь уж и велики. Да и на другой чаше весов был максимально быстрый выпуск 4-ядерных процессоров Core, потенциально способный окончательно "добить" конкурента в лице AMD, который толком ещё не оправился от выпуска 2-ядерных процессоров Core. Для компании Intel, ещё не так давно откровенно прозябавшей со своей не самой удачной архитектурой NetBurst, выбор на тот момент был очевиден — оседлать войну успеха новой архитектуры Core здесь и сейчас, окончательно закрепив за собой лишь недавно возвращённый статус лидера рынка.
реклама
Естественно, первый 4-ядерный настольный x86-64 процессор, как и большинство когда-либо выходивших "экстремальных" процессоров Intel, был продуктом чистом имиджевым. Дело в том, что программное обеспечение для настольных ПК тех лет в массе своей было адаптировано в лучшем случае под 2-ядерные процессоры, так что на практике от дополнительной пары ядер в QX6700 толку было исчезающе мало. А вот цена у новинки была поистине "экстремальная" — $999! И это при том, что "половинка" QX6700 в лице Core 2 Duo E6700 давала примерно тот же уровень производительности в большинстве приложений и игр, будучи почти вдвое дешевле! Понятно, что новый "экстремальный" процессор Intel был, как и все его предшественники, ориентирован на небольшую группу ПК-энтузиастов, вот только на сей раз не на геймеров, а, скорее, на пользователей рабочих станций. Именно они в различного рода профессиональном ПО могли получить доселе невиданный на настольных системах уровень производительности. Для обычных же пользователей оптимальным выбором по-прежнему оставались 2-ядерные процессоры.
Но так продолжалось недолго. Уже в момент выпуска Core 2 Extreme QX6700 Intel анонсировала менее дорогой "не-экстремальный" 4-ядерный Core 2 Quad Q6600, который должен был увидеть свет уже в новом, 2007 году. И в начале января 2007 года этот процессор был действительно представлен миру. Отпускная цена Q6600 изначально была не сильно ниже в сравнении с QX6700, а именно $851, но уже к апрелю упала до $530, а в конце июня опустилась до отметки $266. И это при том, что Core 2 Quad Q6600 отличался от Core 2 Extreme QX6700 всего лишь чуть меньшей тактовой частотой (2.4 ГГц против 2.67 ГГц) и заблокированным множителем. А в те годы, напомню, разгон по шине не был запрещен ни де-юро, ни де-факто, так что указанные отличия были совершенно несущественными. И именно Core 2 Quad Q6600, особенно после летнего снижения цен, стал первым массовым 4-ядерным настольным процессором, открыв новую главу в истории персональных компьютеров.
Конечно же, за прошедшие с момента выхода Core 2 Quad Q6600 годы существенно выросло число инструкций, выполняемых x86-64 процессорами за такт. В процессорах так же появились новые функциональные блоки и соответствующие наборы инструкций, увеличившие производительность в определённых задачах. Банально выросли тактовые частоты и среднее число ядер, возросла скорость обмена данными между процессором и оперативной памятью, а также между ядрами процессора. Заметно улучшилось и масштабирование программного обеспечения на большое количество ядер, которые уже не редкость в современных домашних ПК. Даже игры, долгое время ограниченные преимущественно однопоточной производительностью, с внедрением современных API, таких, как DirectX 12 и Vulkan, стали эффективнее использовать мощности многоядерных процессоров. В общем, технический прогресс всё это время, конечно же, на месте не стоял, вот и давайте сегодня посмотрим, что сможет “старичок” Core 2 Quad Q6600 в современных приложения и играх.
Тестирование: участники
реклама
В роли актуального 4-ядерника выступит Core i3-10100, увидевший свет в апреле 2020 года. В моём блоге год назад уже публиковалась заметка со сравнением Xeon E5450 (аналог настольного Core 2 Quad Q9650) с Core i3-8100 в современных приложениях и играх. Эта статья ещё немного расширяет временные рамки между современными 4-ядерными процессорами и их далёкими предками: участников прошлогоднего тестирования разделяли 10 лет технического прогресса в области процессоростроения, а участников сегодняшнего — уже 13. Так же в прошлый раз соперники были поставлены в не совсем равные условия — Xeon E5450 тестировался в разгоне да ещё и в комплекте с быстрой DDR3-памятью, а Core i3-8100, напротив, с медленной DDR4. Да и 3D-ускоритель (RTX 2060 Super) в том тестировании был всё-таки слабоват.
В этот раз у нас Quad постарше, не только в разгоне, но и в стоке, да ещё и память у него помедленнее (DDR2), а вот современный Core i3, напротив, будет оснащён более быстрой DDR4-памятью. Видеокарта тоже "пободрее" — RX 6800. И здесь сразу отвечу на вопрос, а почему в соперники "старичку" был выбран Core i3-10100, а не Core i3-12100? Внезапно, потому, что у меня i3-12100 нет и, скорее всего, никогда уже и не будет. А покупать, как минимум, материнскую плату + 4-ядерный процессор исключительно ради тестов желания нет. В будущем, впрочем, возможно разорюсь на недавно анонсированный i3-13100(F) с DDR5-памятью — там будет уже 16 лет прогресса! Но то пока только в планах, а сегодня имеем то, что имеем.
Напомню, что за 13 лет процессоры Intel пережили 4 смены микроархитектуры, если считать по "такам" (Core → Nehalem → Sandy Bridge → Haswell → Skylake), 3 смены техпроцесса (45 нм → 32 нм → 22 нм → 14 нм), а заодно и столь "любимые" всеми 5 смен процессорного разъёма (LGA 775 → LGA 1156 → LGA 1155 → LGA 1150 → LGA 1151 → LGA 1200), или точнее даже 6, учитывая две лишь механически совместимые версии LGA 1151. А среди значительного числа микроархитектурных улучшений стоит отметить, как минимум, следующие:
- "Настоящая" 4-ядерность: все 4 процессорных ядра теперь находятся на одном кристалле и имеют в распоряжении общий для всех ядер кэш 3-го уровня.
- Контроллер памяти теперь встроен в процессор и обзавёлся поддержкой DDR4.
- Так же перекочевал из северного моста под крышку процессора и контроллер шины PCI Express.
- Во многих процессорах присутствует встроенное графическое ядро.
- Ядра, встроенная графика, общий L3-кэш и некоторые другие компоненты объединены между собой кольцевой шиной.
- Многочисленные улучшения во фронтенде и бекенде процессорных ядер, включая как простое увеличение количества исполнительных устройств, так и более тонкие архитектурные изменения.
- Появление новых (а также улучшение уже имеющихся) исполнительных устройств и регистров для поддержки новых наборов инструкций, таких, например, как SSE4.1 и 4.2, AVX, AVX2, FMA3, AES.
- Была возвращена поддержка Hyper-Threading и введена поддержка Intel Turbo Boost.
реклама
Небольшие пояснения к таблице:
- Частота для Core i3-10100F указана в бусте по всем ядрам.
- Контроллер памяти для Core 2 Quad Q6600 был частью северного моста чипсета. Официально чипсет Intel P45 поддерживал DDR2-800 и DDR3-1066, но абсолютное большинство производителей материнских плат заявляли о поддержке, как минимум, DDR2-1066 и DDR3-1333.
- Для DDR4-памяти в системе с Core i3 активирован XMP-профиль.
По последнему пункту — в это раз избегаем тестирования Core i3 в паре с "медленной" DDR4-2666 памятью сразу по нескольким причинам. Начнём с того, что даже на момент выхода процессоров Comet Lake DDR4-память с XMP-профилем 3200 стоила лишь немногим дороже в сравнении с DDR4-2666 памятью, так что многие покупали и использовали, как минимум, такие плашки. Тут можно было бы возразить, что в 400-ой серии чипсетов Intel увеличить частоту памяти выше официально поддерживаемой можно было лишь на платах с Z490. Факт, но раз уж мы не может разогнать на используемой современной платформе процессор (ибо множитель заблокирован, а разгон по шине мёртв), то давайте разгоним хотя бы память. А то получилось бы несколько несправедливо — систему с Core 2 Quad Q6600 мы тестировали бы и в стоке, и в разгоне, а система с Core i3-10100 довольствовалась бы исключительно стоковой конфигурацией. Будем считать, что современную платформу мы здесь тестируем в режиме где-то между стоком и небольшим разгоном по памяти.
Основы тестовых стендов LGA 775 и LGA 1200 составляют материнские платы GIGABYTE GA-EP45-UD3R и ASUS PRIME Z490M-PLUS, соответственно. Остальные комплектующие, кроме оперативной памяти и системы охлаждения процессора, идентичны: видеокарта PowerColor AMD Radeon RX 6800 Fighter, SSD Apacer AS350 PANTHER на 512 ГБ под Windows 11 и приложения, SSD Colorful SL500 на 4 ТБ под игры, блок питания CHIEFTEC BDF-1000C. Что касается памяти, то первый тестовый стенд оснащен 4 планками DDR2-1066 CL5 памяти Kingston KHX8500D2 объёмом по 2 ГБ каждая, второй — 2 планками Patriot Viper 4 Blackout DDR4-3200 CL16 памяти объёмом по 4 ГБ каждая (кит PVB48G320C6K). Core i3-10100F охлаждался недавно купленной СВО ID-Cooling FROSTFLOW X 360 (знаю, перебор, но она уже стояла на тестовом стенде), а для Core 2 Quad Q6600 пришлось "расчехлять" старенький Cryorig R1 Ultimate, так как у упомянутой СВО нет креплений на LGA 775.
Core 2 Quad Q6600 был дополнительно разогнан до 390 МГц по шине, так что итоговая частота составила 3.51 ГГц (390×9). Напряжение Vcore в BIOS пришлось поднять до внушительных 1.4875 В, но видавший виды суперкулер со своей задачей справился — даже в стресс-тестах температуры не поднимались выше 72° C по ядрам при Tjunction в 75° C. Горячо, конечно, но для стресс-теста терпимо.
Тестирование: методика
И пара слов о методике тестирование. Производительность будем сравнивать в современном программном окружении, используя актуальные (насколько это возможно) версии тестируемых приложений и игр. Аналогично и с Windows — на оба тестовых стенда была установлена "свеженькая" Windows 11, версия 22H2. Здесь можно возразить, что использование современного ПО ставит участников тестирования в не совсем равные условия, ведь актуальные версии приложений и игр с большой долей вероятности могут использовать наборы инструкций, отсутствующие у "старичка" Core 2 Quad Q6600. Как следствие, значительно более актуальный Core i3-10100 получит от использования SSE4- и AVX-инструкций дополнительное, якобы несправедливое, преимущество. Но я считаю иначе: появление новых наборов инструкций — это, как упомянуто выше, одно из микроархитектурных улучшений, которое ничем по сути своей не отличается от роста тактовых частот или увеличения объёма кэш-памяти. В конце концов, появились все эти наборы не просто так, и транзисторный бюджет на их поддержку был потрачен не смеху ради.
Жаль лишь, что во многих случаях использовать максимально современное ПО в тестах не получится, так как поддержка наборов инструкций, отсутствующих у Q6600 много где уже стала обязательной. В особенности сказанное, конечно же, касается игр, но и многие актуальные версии неигрового ПО уже не так просто или вообще невозможно запустить на стареньких процессорах. Тем не менее, небольшой список вполне себе актуального ПО набрать удалось:
- Для тестов синтетических были выбраны AIDA64 и Geekbench 5. Из первой правда, мы воспользуемся лишь тестами скоростных характеристик памяти, так как бенчмарки вычислительной скорости процессоров мне в Geekbench 5 нравятся сильно больше.
- Некую общую производительность ПК будем измерять с помощью PCMark 10.
- В качестве реального неигрового ПО будут использованы Cinebench R23, Photoshop 2020, Premiere Pro 2022, 7-Zip 22, Blender 3.3, HandBrake 1.5, NAMD 2, Python 3.9.
- И, наконец, игры будет представлены проектами Grand Theft Auto V, Sid Meier's Civilization VI, Shadow of the Tomb Raider, Hitman 2, Metro Exodus, Total War: Three Kingdoms, Borderlands 3, F1 2020.
По играм отмечу, что тестировать будем не только в двух разрешения — HD и QHD, но и (там, естественно, где такое возможно) с использованием двух версий DirectX — 11 и 12.
Тестирование: синтетические и комплексные тесты
AIDA64 Memory Bandwidth & Latency
Столь любимый многими энтузиастами тест пропускной способности памяти в AIDA64 демонстрирует крайне не радужную картину — в сравнении с современной 4-ядерной платформой Intel скорости чтения и копирования у системы с Q6600 в стоке меньше в 6 и 7 раз, соответственно, а по скорости записи преимущество Core i3 вообще практически на порядок. Небольшой разгон памяти в системе с Q6600 позволяет немного сократить отставание, но оно по-прежнему многократное.
При в разы больших показателях пропускной способности латентность памяти на современной платформе заметно ниже. Преимущество сборки с Core i3-10100 над старой платформой с Core 2 Quad Q6600 порядка 40% — чуть больше в сравнении с последней в стоке, чуть меньше — в разгоне.
Geekbench 5
В известном синтетическом наборе тестов Geekbench 5 Core i3-10100 в 3.5 раза быстрее Core 2 Quad Q6600 в однопоточных тестах и более чем в 4 раза в многопоточных. В сравнении с разогнанным Q6600 преимущество современного 4-ядерного процессора в однопоточных и многопоточных сценариях использования уже 2.5- и 3-кратное, соответственно.
Что ж, как видим, с точки зрения бенчмарков синтетических прогресс на месте действительно не стоял.
PCMark 10
Комплексный тест PCMark 10 показывает общую производительность в наиболее распространённых для настольного ПК задачах. Даже в наиболее лёгких, можно сказать "офисных", сценариях (группы тестов Essentials и Productivity) система на Core i3-10100 обходит таковую на Core 2 Quad Q6600 на 70–130%. Ну а в тестах "профессионального" ПО для создания контента (группа тестов Digital Content Creation, DCC), современная платформа быстрее уже на внушительные 180%. В сравнении с разогнанным Q6600, показатели преимущества i3-10100 в упомянутых сценариях составляют уже "всего" 30%, 60% и чуть больше 100%. В целом, выглядит не так уж и плохо, если бы не одно "но".
Как будет показано ниже, в реальном "профессиональном" ПО относительные показатели i3-10100 заметно выше. Возможно, в PCMark сценарии использовании недостаточно сложные, чтобы как следует нагрузить современный 4-ядерник. Или свободное ПО используемое в тестах хуже оптимизировано под современные микроархитектуры нежели коммерческие пакеты. Или некоторая значимая часть работы в тестах PCMark 10 выполняется видеоускорителем, который в обеих системах идентичен.
Тестирование: профессиональное ПО
Cinebench R23
И вот первый пример реального ПО — популярный бенчмарк Cinebench, который позволяет оценить производительность при использовании пакета для создания трёхмерной графики и анимации Cinema 4D. И да, здесь у Core 2 Quad Q6600 всё плохо: Core i3-10100 быстрее "старичка" в стоке и в разгоне в 4.6 и 3.1 раза, соответственно.
Photoshop 2020
Photoshop 2020 — последний выпуск графического редактора Adobe, который без каких-либо манипуляций запустился на Core 2 Quad Q6600. Для оценки производительности использовался бенчмарк от американского сборщика компьютерных систем Puget Systems. Преимущество Core i3-10100 над "старичком" здесь чуть менее внушительное — современные 4-ядерник быстрее Q6600 в стоке и в разгоне в 3.5 и 2.6 раза, соответственно.
Premiere Pro 2022
А вот видео-редактор Adobe Premiere Pro без проблем запустился в своей последней (на момент тестирования) версии. Так же, как и в случае с Photoshop использовался бенчмарк от Puget Systems, и результаты в целом получились аналогичными — современный 4-ядерник оказался быстрее Q6600 в стоке и в разгоне в 3.7 и 2.6 раза, соответственно.
7-Zip 22
Со сжатием данных в популярном архиваторе Core i3-10100 справился в 3.4 раза быстрее стокового Core 2 Quad Q6600. Разгон последнего лишь немного исправил ситуацию, сократив отрыв Core i3-10100 до 2.6-кратного.
Blender 3.3
На рендеринг популярной для целей оценки производительности сцены BMW27 Core i3-10100 потратил более чем в 5 раз меньше времени нежели стоковый Core 2 Quad Q6600. Разогнанный Q6600 оказался медленнее уже "лишь" в 3.6 раза.
HandBrake 1.5
С H.265-кодированием видео пакетом Handbrake Core 2 Quad Q6600 справился ещё хуже — Core i3-10100 оказался быстрее даже разогнанного Q6600 в 5.2 раза! А отрыв i3-10100 от Q6600 в стоке составил 7.6 раза.
NAMD 2
Задачу классической молекулярной динамики в NAMD 2 Core i3-10100 решил быстрее в 3.5 и 2.4 раза в сравнении со стоковым и разогнанным Core 2 Quad Q6600.
Python 3.9
Вычисления с матрицами в многопоточном режиме в Python 3 Core i3-10100 провёл в 2.7 и 1.9 раза быстрее в сравнении со стоковым и разогнанным Core 2 Quad Q6600.
В среднем, таким образом, по группе тестов неигрового ПО имеем более чем 4-кратное превосходство Core i3-10100 над стоковым Core 2 Quad Q6600. Разогнанный Core 2 Quad Q6600 медленнее в среднем в 3 раза.
Тестирование: игры
Среднегеометрические результаты
Результаты в индивидуальных игровых проектах спрятаны под спойлерамы выше, ну а мы подробно обсудим лишь общую картину.
В начале парочка важных наблюдений и выводов, которые будут полезны для будущих исследований, если до них, конечно, дойдут руки.
- Влияние используемого разрешения рендеринга оказалось невелико. Система с Core 2 Quad Q6600, как в стоке, так и в разгоне, показала в среднем лишь на 2–7% более низкую производительность в разрешении QHD по сравнению с HD. С Core i3-10100 показатели в QHD оказались ещё чуть ниже — от 3% до 18%, но в целом разница незначительная. Удивительного в этом факте мало — в исследованных (по уже указанным причинам не самых актуальных) игровых проектах даже i3-10100 не способен как следует загрузить используемый 3D-ускоритель в разрешении QHD. Как следствие, особого смысла в тестировании в QHD-разрешении нет. Можно было бы, конечно, заменить тестирование в QHD на тестирование в 4K UHD, но мне более логичным кажется вариант ограничиться исключительно HD-разрешением. В конечном итоге, в этом исследовании и хотелось добиться минимального упора в GPU в игровых тестах. Да и никто сейчас не мешает и в 4K UHD создать условия практически без упора в GPU — достаточно лишь взять более современный видеоускоритель, скажем RX 7900 XTX.
- Влияние используемого API куда заметнее. В 6 из 8 игровых проектов есть возможность выбора версии DirectX, и производительность при использовании 12-ой версии этого API всегда заметно выше. Правда, есть нюанс: в режиме DirectX 12 Core 2 Quad Q6600 "прибавляет" чуть больше 10% как по средней, так и по минимальной производительности, а Core i3-10100 — чуть больше 20% и 40% по указанным показателям. Таким образом, абсолютные показатели Core 2 Quad Q6600 при использовании DirectX 12 выше, а вот относительные — ниже. Здесь, опять-таки, без сюрпризов. Да, DirectX 12 позволяет лучше распределять нагрузку между ядрами, но чем слабее ядра, тем меньше положительный эффект от такого распределения. Но такова суровая реальность современного ПО, так что в будущем там, где есть выбор тестировать будем исключительно с 12-ой версией DirectX.
А теперь то, ради чего "все мы здесь сегодня собрались":
- В играх по средней и минимальной производительности Core i3-10100 примерно в 4 и 5 раз быстрее Core 2 Quad Q6600 в стоке. Разгон Q6600 поднимает и средние, и минимальные показатели на треть, сокращая преимущество Core i3-10100 до 3.3 и 3.5 раз соответственно.
- Эти показатели близки к полученным в неигровом ПО, где в среднем мы имеем более чем 4- и 3-кратное превосходство Core i3-10100 над стоковым и разогнанным Core 2 Quad Q6600.
- Аналогичную картину мы наблюдали и в тестах синтетических, где в многопоточных тестах Core i3-10100 оказался быстрее стокового и разогнанного Core 2 Quad Q6600 более чем в 4 и 3.5 раз.
Вот такая получается арифметика — более чем 4-кратное увеличение производительности за 13 лет. Вот во что вылились уже ставшие мемом "жалкие" 5% прибавки к IPC в очередном поколении процессоров Intel на дистанции в 13 лет. Кстати, за эти 13 лет у Intel действительной сменилось около 13 поколений процессоров (если считать поколениями и "таки", и "тики", и все 3 этапа формулы "процесс, архитектура, оптимизация"), и если посчитать по формуле сложных процентов, то для получения более чем 4-кратного превосходства реально необходимо около 5.5% прироста производительности в каждом поколении. Курочка по зёрнышку клюёт!
Теги
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила