Ретроклокинг: беспроигрышная лотерея AMD или возможность получить до 500% производительности

Разгон уже не приносит той производительности, что раньше? А ведь были времена, когда можно было получить двух-, трех- и даже четырёхкратную производительность, купив удачный процессор AMD.
13 января 2023, пятница 10:00

Оглавление

Вступление

Лаборатория продолжает цикл статей о ретроклокинге. Ни для кого не секрет, что разгон это лотерея, и в разное время при удачном стечении обстоятельств энтузиаст мог рассчитывать на тридцать, пятьдесят, а если основательно подойти к выбору системы охлаждения, так и на все сто или более процентов прироста производительности.

Наверное, самый простой пример, который помнят большинство местных оверклокеров – это процессоры Intel на ядре Sandy Bridge, которые запомнились моделями Core i5-2500K и Core i7-2600K. Они разгонялись с 3 до 5 ГГц, демонстрируя феноменальную прибавку производительности. А использование системы жидкостного охлаждения позволяло увеличить тактовую частоту еще на 500 МГц.

В итоге самым удачным экземплярам процессоров покорялись частоты в диапазоне от 5.3 до 5.5 ГГц. Достаточно заглянуть в местную «Статистику разгона процессоров» или зайти на HWBOT.org. Продемонстрирую один скриншот и приведу несколько таких примеров: раз, два и три.

Надо отметить, что во времена использования этих процессоров основными системами охлаждения являлись воздушные. В статистике разгона можно встретить как различные варианты Thermalright Archon и Silver Arrow, так и топовых представителей Noctua, например NH-D15 и другие.

Сейчас за окном конец 2022 года, который ознаменовался выпуском передовых и инновационных процессоров AMD Ryzen 9 7950X и Intel Core i9-13900K. Это, конечно, очень быстрые процессоры, но одновременно и очень горячие. Время использования классических воздушных систем охлаждения для таких ЦП прошло, теперь энтузиастам приходится даже снижать рабочее напряжение CPU и использовать трех- и четырехсекционные системы жидкостного охлаждения, которые прочно вошли в обиход.

Ни о каких пятидесяти процентах производительности с помощью разгона речи уже не идет, сейчас задача стоит в удержании рабочих температур ниже 90°C. Возможно, поэтому AMD даже снизила рекомендованную стоимость своей последней линейки процессоров, которые не обеспечили ожидаемый спрос. Раньше было лучше?

Ассортимент ядер компании AMD

Чтобы вернуться во времена, когда трава была зеленее, мороженое слаще, а процессоры холоднее – перенесемся в самое начало 2009 года. В начале января 2009 года компания AMD представила два своих новых процессора на новом ядре Deneb, которое производилось по новому 45 нм техпроцессу и размещало до четырех физических ядер.

Первыми четырёхъядерными процессорами стали AMD Phenom II X4 920 с частотой 2.8 ГГц, с рекомендованной стоимостью $235 и AMD Phenom II X4 940 Black Edition с тактовой частотой 3.0 ГГц, с рекомендованной стоимостью $275 и свободным множителем. Оба CPU получили в свое распоряжение кэш-память третьего уровня объемом 6 Мб и устанавливались материнские платы с сокетом AM2+.

Предыдущая линейка процессоров AMD, относящаяся к линейке Phenom X4 900-й серии, производилась по 65 нм техпроцессу и обладала менее вместительным L3 кэшем объемом 2 Мб. Тактовые частоты у этой линейки также были более скромными; так, топовый представитель AMD Phenom X4 9950 Black Edition работал на частоте 2.6 ГГц.

В феврале 2009 года компания AMD на смену AM2+ сокету выпускает процессоры с поддержкой AM3 сокета, интегрированный контролер памяти которых поддерживал наряду с DDR2-SDRAM еще и новую, для того времени, DDR3-SDRAM память и более высокую скорость работы шины HyperTransport.

Такими процессорами (на все том же четырехъядерном ядре Deneb) стали модели Phenom II X4 900-й серии с L3 кэшем равным 6 Мб, Phenom II X4 800-й серии с L3 кэшем равным 4 Мб, а также трехъядерные модели Phenom II X3 700-й серии на ядре Heka и двухъядерные модели Phenom II X2 500-й серии на ядре Callisto. Процессоры, основанные на ядрах Heka и Callisto, также несли кэш-память третьего уровня объёмом 6 Мб и по сути представляли собой привычное ядро Deneb с отключенным одним или двумя ядрами. Схематично это выглядело так:

Такая система производства различных моделей процессоров была очень выгодна AMD и позволяла использовать отбраковку, которая получалась при производстве ядер Deneb.

Работают все четыре ядра, но не работают 2 Мб из 6 L3 кэша – получаем Phenom II X4 800-й серии. Не работает одно из четырех ядер, не беда – продаем кремний как Phenom II X3, ну а если половина ядер не работает, то получаем Phenom II X2. Схема эта не нова, и сейчас активно используется всеми производителями микрочипов.

Помимо старшей линейки, куда относится весь модельный ряд процессоров Phenom II, у AMD были и бюджетные процессоры, к которым относились одноядерные модели из линейки Sempron 100-й серии и двухъядерные Athlon II X2 200 и 500-й серий. Для этих процессоров использовалось более компактное ядро Regor. Архитектурно вычислительные ядра Athlon II X2 и Sempron 100-й серии не отличались от вычислительных ядер процессоров Phenom II X2 ввиду того, что они использовали абсолютно идентичную микроархитектуру K10 (Stars). Но полупроводниковый кристалл Regor содержал лишь два вычислительных ядра и был лишён кэш-памяти третьего уровня.

Единственным значимым отличием Regor от Deneb было увеличение объёма, принадлежащего каждому вычислительному ядру L2 кэша с 512 Кбайт до 1024 Кбайт. Если в двухъядерном кристалле Regor одно ядро не проходило контроль качества, а в остальном все блоки процессора функционировали должным образом, то из Athlon II X2 получался одноядерный Sempron, ядро которого называлось Sargas.

А теперь немного о рекомендованных ценах для этих процессоров. Младшая модель AMD Sempron 140 с тактовой частотой 2.7 ГГц стоила в момент анонса $36, двухъядерный Athlon II X2 215 с тактовой частотой 2.7 ГГц стоил уже $45, трехядерный AMD Phenom II X3 705 с частотой 2.5 ГГц оценивался уже $125 и далее, по мере возрастания количества ядер и тактовой частоты, топовый AMD Phenom II X4 940 Black Edition с тактовой частотой 3.0 ГГц, продавался по рекомендованной цене $275.

Существовал еще один процессор, который по маркировке относился к предыдущему поколению AMD Athlon X2 5000+, но был основан на полноценном ядре Deneb, у которого попросту были отключены 2 ядра и кэш третьего уровня. Такой процессор имел маркировку AD5000ODJ22GI и работал на очень скромной тактовой частоте, равной 2.2 ГГц. По логике вещей, он должен быть основан на облегченном ядре Regor, но по какой-то причине (возможно большой спрос на бюджетные процессоры) являлся производным от старшего ядра Deneb.

Так как AMD на протяжении всего времени совершенствовала свои процессоры и вносила в них корректировки, появлялись новые степпинги и ядра. Новоиспеченное ядро Propus содержало 4 активных ядра, но было лишено кэш памяти третьего уровня, соответственно в продаже могли быть представлены одни и те же модели процессоров с одинаковым наименованием, но основанные на разных ядрах. Отличить ядра таких процессоров можно было по степпингу, который состоял из пяти заглавных букв и размещался на крышке процессора.

Беспроигрышная лотерея AMD

Был ли смысл для конечного пользователя разбираться во всех тонкостях ядер и их отличиях? Ответ – положительный. Период времени, в котором выпускались эти процессоры можно назвать, временем Великой лотереи AMD, где главным призом была возможность получить полноценный AMD Phenom II X4 900-й серии по цене Athlon X2, Phenom II X3 и т.д, а также из одноядерного Sempron получить двухъядерный процессор. В этой лотерее помимо основных призов были и поощрительные, например счастливчик мог получить в подарок к своему процессору дополнительный L3 кэш объемом 6 Мб и другие более мелкие призы, которые все равно положительным образом влияли на итоговую производительность.

Правила лотереи были просты, нужно приобрести процессор на ядре Deneb, а далее используя материнскую плату того времени зайти в BIOS и выбрать пункт меню, который отвечал за разблокировку дополнительных ядер и L3 кэша. Это если в вкратце.

Лотерея возникла не на пустом месте. Дело в том, что ядро Deneb, можно сказать, стало прародителем всех остальных ядер, в зависимости от модельного ряда в нем производитель отключал часть ядер и/или кэш третьего уровня. В ряде случаев, когда полноценный кристалл не проходил проверку контроля качества, из 4-х ядерной модели можно было сделать двухрядную или трехъядерную, при этом L3 кэш мог быть как рабочим, так и нет. То же самое касалось двухъядерного ядра Regor из половинки которого производись одноядерные Sempron на ядре Sargas.

Кроме реального производственного брака отдельных модулей процессора, в лотерею подключался маркетинг. Его вмешательство заключалось в том, что в случае высокого спроса на младшие модели процессоров с тремя, двумя и т.д ядрами, при отсутствии отбраковки в производство пускался полноценных кристалл, в котором отключалось нужное количество работоспособных блоков для соответствия производимой модели процессора. Удача заключалась в покупке младшей модели процессора, в котором функционируют все отключённые блоки. Для ядра Deneb в идеале это все 4 ядра и L3 кэш в придачу.

Правила лотереи

При покупке Sempron 130, 140, 145, 150 можно было разблокировать второе ядро, получив тем самым Athlon X2. Athlon X2 5000+ (с маркировкой AD5000ODJ22GI) мог стать джекпотом, когда на выходе появлялся AMD Phenom II X4 900-й серии или что-то скромнее, если рабочих ядер оказывалось меньше. Модели Athlon II X2 215 и 220 могли также превратиться в AMD Phenom II X4 900, 800-й серий, в Phenom II X3, Athlon II x3.

Думаю, принцип понятен, ниже можно увидеть список выигрышных комбинаций:

  • Phenom II X4 8хх - 2 Mb кэша L3;
  • Phenom II X3 7хх - четвёртое ядро;
  • Phenom II X2 5хх - 3-е и 4-ое ядра;
  • Phenom II X2 511 и 521 – пропуск хода, разблокировать нечего;
  • Athlon II X4 – бонус раунд + L3 кэш (в случае ядра Deneb);
  • Athlon II X3 - четвёртое ядро + L3 кэш (в случае ядра Deneb);
  • Athlon II X2 модели 215 и 220 – 2 ядра и L3 кэш (в случае ядра Deneb).

Помимо прочего необходимо еще учитывать cледующие правила:

  • Athlon II X2 210e/215/220 имеют лишь 512Кб кэша L2 и бывают на ядрах Deneb, Propus и Regor.
  • Athlon II X4/Х3 могут быть основаны как на ядре Deneb, так и на ядре Propus.

Место размещения степпинга на крышке процессора.

А теперь о том, как отличить потенциально удачное ядро от неудачного. Необходимо взять в руки процессор и посмотреть на его степпинг, который состоит из пяти заглавных букв. Степпингов у одной и той же модели процессора может быть много. Необходимо обратить внимание лишь на 3-ю букву, по ней будет понятно на каком ядре основан конкретный экземпляр процессора.

  • Regor – два ядра без кэша L3. Третья буква «E». Примеры степпингов: AAEEC, CAEEC, NAEIC и т.д.
  • Propus – четыре ядра без кэша L3. Третья буква «D». Примеры степпингов: CADAC, AADAC, NADHC и т.д.
  • Deneb – четыре ядра + L3 кэш. Третья буква «С». Примеры степпингов: CACYC, AACYC, AACSC и т.д.

Условия игры

Набирая эти строки для статьи, я сам сыграл в эту лотерею и не раз, иначе не было бы этой статьи. Мне было интересно, каков шанс приобрести удачный процессор и на практике посмотреть, как работает механизм разблокировки ядер и кэша.

Для этого мне пришлось приобрести не один процессор, поэтому я испытал все чувства: от полного восторга, радости и до разочарования. Что-то разблокировалось на 100%, что-то наполовину, где-то удалось получить лишь только бонус в виде L3 кэша, а часть не разблокировалась вообще, но об этом чуть ниже.

Основная идея такой лотереи состояла в приличной экономии средств, а если к сопутствующей удаче добавить разгон, то можно было получить производительность выше, чем у AMD Phenom II X4 940 Black Edition, но 2-3-5 раз дешевле, в зависимости от своего везения и воли случая. Основным условием игры было наличие материнской платы с AM2+/AM3 сокетом и южными мостами SB710 или SB750. Также в качестве альтернативы подходили материнские платы, основанные на чипсетах NVIDIA: GeForce 7025, GeForce 8200, GeForce 8300, nForce720D и nForce 980.

Практически все производители материнских плат добавляли в свои BIOS опции, с помощью которых можно было разблокировать отдельные элементы процессора. Называлась эта опция, как правило, Advanced Clock Calibration или ACC, хотя некоторые производители называли ее по-своему, например у некоторых моделей Gigabyte она называется CPU Unlock.

Также некоторые производители выделяли в отдельный пункт разблокировку L3 кэша, а некоторые имели только одну опцию ACC, где кэш всегда включался вместе с указанным количеством ядер. В таком случае, если все разблокированные ядра содержали ошибки, а L3 кэш оказывался рабочим, пользователь лишался возможности выключить все нерабочие ядра и включить отдельно только L3 кэш.

Для проведения эксперимента я выбрал правильную материнскую плату, которая имеет возможность включать и выключать по отдельности все функциональные части процессора.

Подготовка тестового стенда

Выбирая материнскую плату для тестового стенда, я решил, что плата должна быть не дорогой, а наоборот – начального уровня. Основная идея заключалась в моделировании ситуации, когда экономный пользователь, обладающий скилами «оверклокинг» +7 и «удача» +10, собирает систему с наименьшей стоимостью и с помощью лотереи, удачи и разгона, получает итоговую производительность на 100, 200, 300 и более процентов, по отношению к штатному состоянию системы (без разблокировки).

Поэтому в качестве материнской платы будет выступать ASRock N68C-S UCC с набором системной логики NVIDIA GeForce 7025, которая относится к бюджетному сегменту, довольствуется одним слотом PCI-Express x16, парой PCI, одним PCI-express x1 и четырьмя слотами для оперативной памяти.

Два слота поддерживают память стандарта DDR2-SDRAM и еще два более прогрессивную DDR3-SDRAM. Максимальный поддерживаемый объем памяти для каждого типа памяти составляет 8 Гб, что было более чем достаточно для того времени.

Формат используемой платы – mATX, но несмотря на это плата имеет 4 x SATA2 интерфейса со скоростью передачи данных 3.0 Гб/с и поддержкой функций RAID, 5.1 HD канальный аудиокодек (VIA VT1705) и 100 Мбит сетевой адаптер. Помимо всего прочего плата оснащена встроенным графическим ядром с поддержкой DirectX 9C, где в качестве видеобуфера можно выделить до 256 МБ из оперативной памяти. В принципе эта плата имеет все, что нужно для построения начальной игровой конфигурации. Единственным минусом можно считать поддержку платой процессоров с TDP до 95 ватт, в остальном она идеальна для бюджетной сборки, особенно учитывая ее стоимость. На момент продажи она находилась в диапазоне от 50 до $60.

Чтобы показать на примере ASRock N68C-S UCC, как происходит разблокировка дополнительных ядер и кэша, приведу скриншоты из BIOS.

А теперь остановлюсь на процессорах, которые выиграли в лотерею. Первое место: Athlon X2 5000+ (с маркировкой AD5000ODJ22GI). Процессор обладает двумя ядрами, работающими на скромной частоте, равной 2.2 ГГц.

Кэш-память третьего уровня у него отсутствует. Процессор сорвал джекпот, в нем благополучно разблокировались два дополнительных ядра и L3 кэш объемом 6 Мб. В результате вместо Athlon X2 5000+ получился Phenom II X4 900-й или Phenom FX-5000 по данным диагностических утилит.

Мне его еще предстоит разогнать и затем произвести замер прироста производительности между исходным состоянием до разблокировки и в разблокированном виде с разгоном. Вангую увидеть +400% прироста.

В качестве второго счастливчика выступает самый младший Sempron c модельным номером 140. Его одно ядро работает на частоте 2.7 ГГц, но по сравнению с Athlon X2 5000+ его L2 кэш равен 1 Мб, против 512 Кб.

Не буду приводить статистику, сколько Sempon’ов я перебрал, но данному экземпляру повезло, и он превратился в двухъядерный заряженный Athlon II X2. По данным диагностических утилит Sempron превратился в Athlon II X2 440.

С трёхъядерными процессорами мне не повезло. Единственный удачный Athlon II X3 445 с частотой 3.1 ГГц, с 512 Кб кэш памяти второго уровня выиграл бонус раунд в виде бесплатного L3 кэша объемом 6 Мб и превратился в Phenom II X4 B45. Хотя это даже к лучшему, будет интересно посмотреть, сколько прибавки производительности даст дополнительный «жирный» L3 кэш.

В итоге в турнирной таблице буду представлены результаты вышеуказанных процессоров по умолчанию и в разблокированном виде с разгоном. Цель - подсчет количества полученной производительности в процентах, относительно номинала и как следствие экономия виртуальных средств, как если бы пользователю улыбнулась удача. Также отдельно будет результат Athlon II X3 445 с включённым L3 кэшем и без, на одинаковой частоте (по дефолту) для оценки размера «бонуса».

Необходимо отметить, что в былые времена были популярны конкурсы по такого рода разгону, где сравнивалась производительности системы по умолчанию и в разгоне. Главный критерий таких соревнований – итоговый процент разгона системы до и после. Дополняли картину в те годы видеокарты AMD ATI Radeon HD 6000-й серии, когда простой перепрививкой BIOS из ATI Radeon HD 6950 получалась старшая версия ATI Radeon HD 6970. В результате такой перепрошивки количество потоковых процессоров увеличивалось с 1408 до 1536 шт. и на 80 МГц подрастала частота GPU, и на 500 МГц видеопамять.

Владея удачным экземпляром процессора AMD Athlon X2 5000+, который без разблокировки и разгона не мог полностью загрузить видеокарту, и с последующей разблокировкой и разгоном можно было рассчитывать на космические цифры прироста итоговой производительности, измерявшейся в сотнях процентов.

Тестовый стенд и тесты

Конфигурация тестового стенда:

Процессор:

  • AMD Athlon X2 5000+ (AD5000ODJ22GI), 2.2 ГГц, Deneb, AM2+;
  • AMD Sempron 140, 2.7 ГГц, Regor, AM2+/AM3;
  • AMD Athlon II X3 445, 3.1 ГГц, Deneb, AM2+/AM3.

Материнская плата:

  • Asrock N68C-S UCC, чипсет NVIDIA GeForce 7025, BIOS ver. 1.60;

Оперативная память:

  • Corsair XMS2 DHX, DDR2-SDRAM 800 МГц, PC2-6400, CL-4, 2х 1024 Мб;

Видеокарта:

  • MSI GeForce 6800 Ultra PCI-Express 512 Мб (Forceware 81.85).

Тестирование проводилось в Windows XP Sp3 с помощью следующего ПО:

  • Super Pi mod. 1.5XS (задача 1M);
  • PiFast v.4.1;
  • wPrime v.1.43;
  • HWBOT Prime v.0.8.3;
  • WinRAR x86 v. 5.40;
  • Cinebench 2003;
  • Cinebench R11.5;
  • 3Dmark2001SE Pro b330;
  • 3DMark 2003 v.3.6.1;
  • 3DMark 2005 v.1.3.1;
  • AIDA64 5.50.3600;
  • CPU-Z benchmark v.2.03.0 x32.

Результаты тестирования

Super Pi mod. 1.5XS

Super Pi mod. 1.5XS (задача 1M)

Время, секунды
Меньше – лучше

AMD Athlon X2 5000+ с 2.2 ГГц добрался до 3.4 ГГц, обогнав тем самым по частоте первого флагмана новой платформы AMD Phenom II X4 940 Black Edition с тактовой частотой 3.0 ГГц. Разгон процессора уперся в частоту системной шины, которая была увеличена с 200 до 309 МГц. Используя материнскую плату классом выше, можно было рассчитывать еще на энное количество дополнительных мегагерц.

AMD Sempron 140 покорилась итоговая частота 3.8 ГГц, а AMD Athlon II X3 445 с дефолтных 3.1 ГГц взял ровно 4 ГГц.

PiFast v.4.1

PiFast v.4.1

Время, секунды
Меньше – лучше

wPrime v.1.43

wPrime v.1.43

Время, секунды
Меньше – лучше

В данном многопоточном тесте хорошо заметен прирост производительности от разблокировки ядер.

HWBOT Prime v.0.8.3

HWBOT Prime v.0.8.3

Итоговый балл
Больше – лучше

WinRAR x86 v. 5.40

WinRAR x86 v. 5.40

Кбайт/с
Больше – лучше

Cinebench 2003

Cinebench 2003

Баллы
Больше – лучше

Cinebench R11.5

Cinebench R11.5

Баллы
Больше – лучше

3DMark 2001 SE Pro b330

3DMark 2001 SE Pro b330

Итоговый балл
Больше – лучше

3DMark 2003 v.3.6.1

3DMark 2003 v.3.6.1

Итоговый балл
Больше – лучше

3DMark 2003 v.3.6.1 – CPU Test

Итоговый балл
Больше – лучше

3DMark 2005 v.1.3.1

3DMark 2005 v.1.3.1

Итоговый балл
Больше – лучше

3DMark 2005 v.1.3.1 – CPU Test

Итоговый балл
Больше – лучше

AIDA64 5.50.3600

Cache and Memory benchmark:

Нажмите для увеличения.

CPU-Z benchmark v.2.03.0 x32

CPU-Z benchmark v.2.03.0 x32

Итоговый балл
Больше – лучше

Заключение

Как видно из результатов тестирования, удача играет не последнюю роль в жизни энтузиаста. На данном конкретном примере заметно, что при определенных обстоятельствах можно было получить солидные цифры и реальную производительность более 400%, что на сегодняшний день просто фантастика. И даже если удача улыбалась лишь частично, и вместо джекпота вытягивался бонус в виде дополнительного L3 кэша, то это также положительно отражалось на итоговой производительности.

Сейчас это только игра, но существует ли возможность повторения данной истории в наши дни? Думаю, определенные шансы есть. Пусть за прошедшие годы количество транзисторов в процессорах увеличилось и технологии стали намного сложнее, но шанс остается. У AMD, с её чиплетной компоновкой процессоров, он может когда-нибудь воплотиться в реальность, особенно учитывая то явление, когда в одном чиплете используется только шесть активных ядер из восьми.

В серверном сегменте Intel сейчас активно продвигает новую программу под названием «On Demand», которая предлагает программную активацию дополнительных возможностей процессоров Xeon за отдельную плату. Данная программа будет доступна для новых серверных ЦП Xeon Scalable четвертого поколения семейства Sapphire Rapids. Если программа заработает, то дополнительные, гарантированно рабочие процессорные ядра и блоки можно будет включать софтверным методом. Так что лазейка для разблокировки остается.

В истории уже были прецеденты использования специального кода активации для разблокировки дополнительного кэша процессора и технологии Hyper-Threading у процессоров Intel. Так, в 2010 году владельцы процессора Intel Pentium G6951 (семейство Clarkdale, LGA 1156) могли за $50 приобрести код активации, введя который можно было получить дополнительный 1 Мбайт кэш-памяти третьего уровня и активировать поддержку технологии Hyper-Threading.

Позже Intel экспериментировала с процессорами семейства Sandy Bridge. В их случае у Core i3-2312M, Core i3-2102 и Pentium G622 можно было программным путем увеличить тактовую частоту (за счет установки более высокого множителя) и получить дополнительный объем кэш-памяти третьего уровня. Но в итоге программа была свернута из-за отсутствия интереса у покупателей.

Это были примеры увеличения производительности за дополнительные деньги, а в случае с процессорами AMD, основанными на ядре Deneb, пользователи получали этот шанс бесплатно.

В данной статье я не упомянул о процессорах AMD Phenom II, основанных на ядре Thuban, которые несли на борту шесть физических ядер и L3 кэш объемом 6 Мбайт. Какое-то время компания AMD производила на их базе четырехъядерные CPU, у которых два ядра были отключены, и у пользователей был шанс на их разблокировку… Но это уже другая история.

Максим Романов aka Max1024