Разгон двухъядерного процессора AMD с неисправным внешним кешем

для раздела Блоги

AMD Athlon64 4400+ X2 без кеша в тестах. 22.06.2008
Аннотация.

Описан опыт восстановления работы и последующего разгона частично повреждённого процессора. Получены выводы, которые помогут лучше управлять способами разгона с другими процессорами.
Представлен пошаговый процесс разгона, который позволит опытным оверклокерам проследить за ходом "матча", а неопытным - посмотреть порядок действий для достижения успеха в подобных случаях. Этим самым, статья продолжает "образовательную" серию статей "Оверклокинг - в массы", начатую статьёй о разгоне процессора FX-57.

Причины и последствия.

Столь удивительный режим разгона заставил использовать один не работающий экземпляр процессора AMD Athlon64 4400+ X2. Ко мне он пришёл частично исправным, и то, что с ним дальше происходило, нельзя было не описать, чтобы поделиться результатами и возможностями его восстановления.

Поведение его было таким: на уровне биоса процессор стартует, отлично работает с биосом, выводит список операционных систем из boot.ini. Но как только попадает при запуске Windows в вывод графической заставки - не показывая её, виснет. Произошло это, как рассказывал бывший владелец процессора, оттого, что процессор работал некоторое время с остановившимся вентилятором на медном кулере. Заметили неполадку, когда система перестала работать.

Чтобы как-то вернуть процессор к жизни, виделись несколько путей: понизить напряжение на ядре, попытаться изменить некоторые другие настройки биоса, относящиеся к процессору. Понижение питания даже до 1.25 В (номинал 1.35) картины не меняло, а далее он не запускался. Отключение инструкций SSE2 - тоже. Тут вспомнилась непонятно зачем присутствующая во всех биосах настройка - отключение внешнего кеша, которая всегда приводит к замедлению работы, очевидно. И она сработала - процессор нормально загрузил WindowsXP и ничем себя сильно не выдавал, разве что немного более продолжительной загрузкой системы. Тесты все (SnM, 3DMark, SuperPi) показали, что на номинальных частотах и с пониженным напряжением на ядре он работает. Низкое напряжение на ядре было не решающим фактором работоспособности, но раз он работает на низком, то почему бы так не оставить и не тестировать дальше? (Далее режим пониженного напряжения при отключённом кеше показал, что он работает при заметно более высоких частотах, чем обычно.)

Инструменты сравнения.

Вычисление SuperPi показывает скорость 1 ядра процессора, поэтому может сравниваться с показаниями одноядерных процессоров, и выводы, соответственно, будут подходить и для них. Без разгона они имеют среднее время SuperPi 1M = 50s (секунд) для частоты около 2000 МГц с некоторой зависимостью от настроек памяти. Поэтому падение вычислительных способностей ядра будем оценивать относительно этого номинального результата. Чем больше время расчёта, тем медленнее работает процессор.

Запуск SuperPi не ставил задачу получения рекордного результата. Не отключались службы интернета и прочие, выключалась только висящая в трее Riva Tuner, не устанавливалась специально новая ОС. Но соблюдались остальные обычные правила запуска этого теста, позволяющие иметь разброс показаний всего 0.2-0.3 с на фоне 1 минуты и 30 секунд, что довольно неплохо, и допускало запуск теста 1 раз. Вот эти правила:
*) выключить (или не запускать) все возможные программы и окна (но не останавливались службы и процессы);
*) после старта Win проходит 1-2 минуты, чтобы движения диска полностью успокоились и не были слышны;
*) перед окончательным пуском теста выжидается 5-6 секунд, когда диск ещё может помешать точной оценке;
*) при работе не трогается клавиатура и мышь.
Если даже соблюсти все формальности, улучшение показаний могло бы быть ориентировочно на 1-2 с, что несущественно для наших сравнений.

Второй инструмент, который покажет достоинства работы 2 ядер в 1 приложении - это 3DMark 2006. Будем смотреть не на суммарный результат, а на результат вычислительного теста в нём (3-е число, CPU Score). Он обычно слабо зависит от видеокарты и материнской платы, и приблизительные ориентиры в нём такие:

Одноядерный Athlon64 без разгона: 700.
Одноядерный Athlon64 с разгоном до 2700М: 1000.
2-ядерный с разгоном до 2500: 2000.
Core2Duo с разгоном до 3-3.2 ГГц: 2800.

Конфигурация.

В экспериментах принимали участие следующие комплектующие:

Процессор: AMD Athlon64 4400+X2 (Toledo), кеш 1-го уровня - 2 по 64 КБа данных и столько же для инструкций; кеш 2-го уровня вегда отключен, не работающий (номинально 2 по 1024 КБа);
Мат.плата: DFI LP UT NF4 Expert, Bios 6.00 PG (04/06/2006);
Кулер: Thermaltake Big Typhoon;
Память (1 планка): Samsung PC3200U-30331-E0 1GB DDR PC3200 CL3;
Память (быстрая, 2 планки): Geil CL2-2-2 UltraX400 2x512Mb;
Видеокарта: ATI Radeon 2600XT DDR4 256MB;
Диск: Seagate 200 GB IDE;
ОС: WinXP SP2 с пакетами обновлений.
Замечания: благодаря переменной скорости вращения кулера на данной плате, можно было не сильно заботиться об оборотах и охлаждении - при выставлении предела низких оборотов на 40 град в биосе, вентилятор вращался на 2200 об/мин при менее 40 град. и плавно увеличивал обороты до 4800 при 62 град, будучи, однако, тихим. (Установлен без прижима, что ещё бы улучшило показания на 2 град.) При разгоне памяти и питании выше 3.3V понадобилось охлаждение модулей большим замедленным вентилятором размером 80 мм. Диск тоже немного влияет на SuperPi, но система не устанавливалась на быстрый диск, так как не было задачи получения лучших абсолютных результатов. Расположение комплектующих - открытый стенд. Вид стенда в действии:


Данные и процесс разгона.

Будем отображать результаты экспериментов в таком виде (В первой строке установки, во второй - измерения, красным будут выделяться изменившиеся установки.) :
Процессор: частота шины, множитель, напряжение память: остновные тайминги (дополнительные), CR, дуальность, частотный показатель, напряжение
Частота ядра процессора, частота и делитель памяти тесты: SuperPi 1M, SnM не менее 15 мин, 3DMark06
SuperPi 1M - показания программы SuperPi (время работы) при вычислении теста с параметром 1М.
Основные тайминги памяти - (Tcl-Trcd-Tras-Trp, CPC), дополнительные - (Trc-Trfc-Trrd-Twr-Twtr-Trwt) или значения Auto, если не отмечаются.
Частоты процессора и памяти читаются в программе CPUz, напряжения пишутся из настроек биоса, не из мониторинга.
3DMark 2006 показывает общий счёт и 3 основных составляющих, главная для процессора из них - последняя (CPU Score).


После удачного старта без кеша 2-го уровня система на медленной (обычной) памяти показала такие результаты:
235M, 11x, 1.275V 3-3-3-7, 1T, Single ( 140М, 2.7V ОЗУ - bios)
2530M, 172M ОЗУ SPi1M=1m39.4s; SnM: работает; 3DM06: 4124(1543,1898,1334)
Приведён случай c некоторым разгоном, чтобы не смотреть на заведомо неинтересные номинальные результаты. Впрочем, в конце мы их получим и приведём для сравнения, а пока что стоит задача получить максимальный разгон.

Далее, была взята частота FSB:
242M, 11x, 1.275V 3-3-3-7, 1T, Single
2661M, 190M ОЗУ SPi1M=1m35.4s; SnM: ошибки в нагрузке (FPU)
...поэтому вернулись к 240 МГц.
240M, 11x, 1.275V 3-3-3-7, 1T, Single
2640M, 188M ОЗУ SPi1M=1m35.0s; SnM: работает, 67 град.
Показания 67 град. связаны с некоторыми ошибками датчиков; к тому же, драйвер в системе установлен от другой платы (Epox). В измерении скорости оборотов в биосе тоже регулярно наблюдадись ошибки, поэтому больше внимания в тесте обращали на поведение при нагрузке и работоспособность, чем на абсолютные показания. Кроме того, с более мощным кулером или охлаждением получатся заведомо лучшие результаты, но сейчас стоит задача сравнить режимы и получить рабочий компьютер с разными вариантами комплектующих.

Заменяем память на более быструю. Но, пока не настроены её режимы работы, довольствоваться приходится низкими частотами (В биосе - 140 МГц частоты памяти):
240M, 11x, 1.275V 2-2-2-5, 2T, Dual, 140 MHz, 3.1V
2640M, 165M ОЗУ SPi1M=1m29.0s

Чтобы сделать следующий шаг разгона, заменяем автонастройки памяти на фиксированные значения. (Тайминги в скобках соответствуют сигналам Trc-Trfc-Trrd-Twr-Twtr-Trwt.)
240M, 11x, 1.275V 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 150 MHz, 3.1V
2640M, 175M ОЗУ SPi1M=1m24.7s

240M, 11x, 1.275V 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 166 MHz, 3.3V
2640M, 188M ОЗУ SPi1M=1m21.0s

Следующий режим работал на 3.3 V памяти, но к нему пришлось вернуться и обнаружить, что 3.2 V он тоже поддерживает и проходит 3DMark:
240M, 11x, 1.275V 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 180 MHz, 3.2V
2640M, 220M ОЗУ(1/12) SPi1M=1m15.0s; SnM: работает, 3DMark06: 4632(1681,2158,1547)
(В показаниях 3DMark особо интересно 3-е число из составляющих, а на остальные можно не смотреть. Оно показывает производительность процессора. Известно, что 1-ядерный процессор при разгоне примерно до 2600-2700М имеет величину этого показателя порядка 980-1000 (независимо от видеокарты). 2-ядерный в разгоне до 2400-2500 - 2000 единиц.)

Пробуем уменьшить важный тайминг Command Rate (1Т/2Т):
240M, 11x, 1.275V 2-2-2-5 (7-12-3-3-2-3), 1T, Dual, 180 MHz, 3.3V
2640M, 220M ОЗУ(1/12) SPi1M=1m11.8s, SnM, 3DMark06: с ошибками, не запускается

240M, 11x, 1.275V 2-_3_-2-5 (7-12-3-3-2-3), 1T, Dual, 180 MHz, 3.2V
2640M, 220M ОЗУ(1/12) SPi1M=1m14.0s, SnM, 3DMark06: с ошибками, не запускается
Выяснив пределы продвижения по таймингам и то, что Command Rate 1T/2T не даёт решающего прорыва, а проблем привносит, выбираем следующий режим (повышаем реальную частоту памяти до 240 МГц):
240M, 11x, 1.275V 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 200 MHz, 3.2V
2640M, 240M ОЗУ(1/11, синхронный) SPi1M=1m14.0s, SnM: имеет ошибки памяти; 3DMark06: с ошибками, не запускается
Синхронность, как видно, не принесла выдающихся плодов, что в общем, для Athlon64 - знакомая картина.

Возврат к 3.3V на памяти частично решил вопрос правильной работы в тестах. Правда, пришлось ещё ставить несильный обдув памяти 80-мм вентилятором, иначе ошибки начинались где-то на 3-й минуте работы. SnM: работает, темп. в тесте процессора - до 67 град., 3DMark06: не запускается графика (после загрузки первого сэмпла). Повышение до 3.4 V эффекта с 3DMark не изменило (переход на 2-3-2-5 тоже, понижение частоты FSB до 236 - тоже; точнее, система стала виснуть на этой точке; на FSB=232 М картина не изменилась, а SuperPi вырос до 1m14.7s, что близко к 1m15.0s из настройки с последним работающим 3DMark), а жаль - хорошая скорость работы памяти сильно сказывается на вычислительной мощности сейчас. Возможно, подстройка второстепенных таймингов помогла бы в работе, но заниматься этим не имеет большого смысла - способности системы оцениваются, а не настраиваются для работы. (Впоследствии было обнаружено, что увеличение одного Tcl до 2.5 решил вопрос с разгоном до 240 без ошибок.)

Незапуск 3DMark - указание на то, что система неполноценна, но даже если бы мы добились работы в нём, он тоже не проверяет все ошибки. Если бы была возможность позапускать несколько игр и прокомпилировать сложный проект - сумма таких тестов сказала бы почти гарантированно о стабильности, но пока этого не требуется, система на открытом стенде. Будем считать, что система стабильна на предыдущем полноценном измерении:
240M, 11x, 1.275V 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 180 MHz, 3.2V
2640M, 220M ОЗУ(1/12) SPi1M=1m15.0s, SnM: работает; 3DMark06: 4632(1681,2158,1547)
Эти данные говорят, что в типичных вычислениях (SuperPi) система отстаёт от разогнанных процессоров с кешем примерно вдвое (75/35). В вычислениях, связанных с графикой, где, видимо влияние кеша меньше из-за большого количества данных - отстаёт на 30% (1-1547/2000). (Среднее замедление времени работы, вероятно, будет ещё меньше, что впоследствии можно проверить, запустив PCMark.)

Такие или немного лучшие показания зафиксированы на скриншоте.
Память работала в дуальном режиме. Результирующая строка в принятых сокращениях будет выглядеть так:
240M, 11x, 1.275V 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 180 MHz, 3.2V
2640M, 220M ОЗУ(1/12) SPi1M=1m14.8s, SnM: работает; 3DMark06: 4610(1678,2142,1542)
(К примеру, видимое Core Voltage отличается от установленного в биосе 1.275 V, но пишется в строке установка биоса как более надёжная.)

Сравним ещё разницу между одноканальным и 2-канальным режимами памяти, вынув одну планку.
240M, 11x, 1.275V 2-2-2-5 (7-12-3-3-2-3), 2T, Single, 180 MHz, 3.2V
2640M, 220M ОЗУ(1/12) SPi1M=1m22.5s, SnM: работает; 3DMark06: 4461(1629,2067,1492)
Падение скорости вычисления SuperPi: 10% (1-82.5/75).
Уменьшение общего счёта 3DMark06: 3.6% (1-1492/1547).
Уменьшение счёта CPU Score в 3DMark06: 3.6% (1-1492/1547).

Наконец, приведём показания марков в неразогнанном режиме.
200M, 11x, 1.275V 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 200 MHz, 3.0V
2200M, 200M ОЗУ(1/11) SPi1M=1m25.3s, SnM: работает; 3DMark06: 4319(1615,2040,1319)
Тоже очень интересно, оказалось. Скорость сильнее зависит от таймингов памяти, чем от разгона процессора. Работает быстрее, чем с одиночной обычной памятью на разгоне 2661 мГц. И так же по тестам 3DMark06, как с обычной памятью на разгоне 2530 М (235 М FSB).

Дополнение от 25.06.2008. С кулером Zalman CNPS9700 Cu и 2 вентиляторами на нём (ради неповышения шума) вот что удалось получить:
253M, 11x, 1.275V _2.5_-2-2-5 (7-12-3-3-2-3), 2T, Dual ( 180М, 3.0V ОЗУ - bios)
2861M, 232M ОЗУ(1/12) SPi1M=1m12.3s; SnM: работает; 3DM06: 4684(1688,2171,1609)
C ошибками по перегреву в FPU-тесте работает до 260 МГц (2861M) при 1.30V, то есть для водяного охлаждения запас разгона у него ещё очень большой. Хороший был процессор. (Способа менять размер кеша перемычками - по Сети не нашёл. Если он существует, может быть, кто-то подскажет?)

Для наглядности результатов сведём полученные данные бенчмарков в таблицу. (Читатели хотят зрелищ, надо что-то придумать.) Имеем 4 приблизительных значений скоростей разных процессоров в обоих бенчмарках и 4 измерения исследуемого процессора в разных режимах. Расстановка их в ряду гистограммы вполне показывает достигнутое, и можно переходить к выводам. С одной оговоркой: чтобы наглядно показать быстродействие при вычислении SuperPi, была взята шкала по формуле 100000/SuperPi1M.



Выводы.

Выводы получились богатые и многоплановые. На процессор посмотрели под другим, нетрадиционным углом. Сразу открылись несколько любопытных фактов.

1) Процессор с отключённым внешним кешем может полноценно использоваться _для временной замены другого процессора_ в случае его отсутствия и даже полноценно работать в компьютере, создавая лишь некоторое замедление общей работы (в худшем случае - до 40% от номинальной скорости базового исправного процессора).

2) Отключение кеша благотворно сказывается в _понижении напряжения на ядре_ (надо проверить вывод - возможно, это из-за ядра Toledo, но по логике, потребление хотя бы уменьшается). Следовательно, возможен разгон до больших частот, чем с кешем. Следствие - возможно "не совсем честное" достижение рекордов разгона по частоте. Но повышение частот и понижение тепловыделения также немного компенсирует потерю производительности при отключении кеша, если сравнивать не равные частоты, а предельные для разгона (на воздухе, где критично тепловыделение) в том и другом случаях.

3) Видимо, процессор с отключённым кешем допускает _несколько больший разогрев_. Во всяком случае, для данного экземпляра была рабочей температура (точнее, её показатель в тесте) 67 град, в то время как процессоры 3200+ на этой же плате обычно зависали при более 60 град. Доказать это сможет эксперимент с исправным процессором с намеренно отключаемым кешем. Если это так, то отключение кеша - ещё одно основание для получения экстремального разгона с ограниченным охлаждением.

4) Конечно, _выбор быстрой памяти_ и её разгона сильно сказывается на вычислительной скорости такого процессора. Если считать 50 секунд в SuperPi 1M "мечтой" бескешевого процессора в достижении минимальной полноценности неразогнанного A3000+, то в экспериментах с памятью DDR440, 2-2-2-5, он отстаёт от неё всего на 30% (1-50/72). Количественно, улучшение памяти дало прирост: 95(s)/75 - на 26 %, что значительно больше, чем обычные результаты с кешем (конечно, в данном случае попался ещё удачный результат работы теста на частоте памяти 220 МГц, а первое число получено в режиме Single Channel). Если память такая будет значительно дороже (например, на стоимость исправного процессора), то гнаться за ней нет смысла. Она будет полезна, если окажется "под рукой".

5) Использование двухканальной памяти будет эффективнее, чем у процессора Athlon64 с кешем (у которого средний прирост в SuperPi - 6%). Выигрыш - 10%. Не во всех вычислениях это так заметно. Например, по тесту Cpu Score в 3DMark06 ускорение - на 3.7% (1547/1492-1), как, впрочем, и увеличение общего счёта теста (3.6%).

6) Разгонять частично исправный процессор можно, стабильность тестов от этого не страдает.


Результаты показывают, что даже по тестам SuperPi, имеющим интенсивный обмен с кешем, процессор стал лишь немного отставать от стандартного 3000+ без разгона. Это значит, что и при самых тяжёлых для отсутствия кеша вычислений он будет не сильно проигрывать нормальным Атлонам (конечно, за счёт полученного разгона и быстрой памяти), а в двуядерных работах будет превосходить их. Общий вывод: если попадётся такой процессор как альтернатива одноядерному, то, скорее всего, он удовлетворит пользователя (по крайней мере, как временное решение). Если без кеша окажется одноядерный процессор - отставание в вычислениях будет 25-50%, что терпимо, но отставание от разогнанного одноядерного с SuperPi порядка 35с будет раза в 2-2.5, что может устроить лишь временно. Потому что будут наблюдаться "странные" замирания вычислений на привычных простых вещах: архивация, декодирование, рендеринг, игровые обсчёты, и система будет вести себя немного иначе, хотя среднее замедление вряд ли будет больше 50%.

Обсудить статью или сделать замечания, дополнения, ссылки, прошу здесь: Статья "Разгон 2-ядерного процессора AMD с неисправным внешним кешем"
Telegram-канал @overclockers_news - это удобный способ следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают