Разгон двухъядерного процессора AMD с неисправным внешним кешем
реклама
Описан опыт восстановления работы и последующего разгона частично повреждённого процессора. Получены выводы, которые помогут лучше управлять способами разгона с другими процессорами.
Представлен пошаговый процесс разгона, который позволит опытным оверклокерам проследить за ходом "матча", а неопытным - посмотреть порядок действий для достижения успеха в подобных случаях. Этим самым, статья продолжает "образовательную" серию статей "Оверклокинг - в массы", начатую статьёй о разгоне процессора FX-57.
Причины и последствия.
Столь удивительный режим разгона заставил использовать один не работающий экземпляр процессора AMD Athlon64 4400+ X2. Ко мне он пришёл частично исправным, и то, что с ним дальше происходило, нельзя было не описать, чтобы поделиться результатами и возможностями его восстановления.
Поведение его было таким: на уровне биоса процессор стартует, отлично работает с биосом, выводит список операционных систем из boot.ini. Но как только попадает при запуске Windows в вывод графической заставки - не показывая её, виснет. Произошло это, как рассказывал бывший владелец процессора, оттого, что процессор работал некоторое время с остановившимся вентилятором на медном кулере. Заметили неполадку, когда система перестала работать.
Чтобы как-то вернуть процессор к жизни, виделись несколько путей: понизить напряжение на ядре, попытаться изменить некоторые другие настройки биоса, относящиеся к процессору. Понижение питания даже до 1.25 В (номинал 1.35) картины не меняло, а далее он не запускался. Отключение инструкций SSE2 - тоже. Тут вспомнилась непонятно зачем присутствующая во всех биосах настройка - отключение внешнего кеша, которая всегда приводит к замедлению работы, очевидно. И она сработала - процессор нормально загрузил WindowsXP и ничем себя сильно не выдавал, разве что немного более продолжительной загрузкой системы. Тесты все (SnM, 3DMark, SuperPi) показали, что на номинальных частотах и с пониженным напряжением на ядре он работает. Низкое напряжение на ядре было не решающим фактором работоспособности, но раз он работает на низком, то почему бы так не оставить и не тестировать дальше? (Далее режим пониженного напряжения при отключённом кеше показал, что он работает при заметно более высоких частотах, чем обычно.)
Инструменты сравнения.
Вычисление SuperPi показывает скорость 1 ядра процессора, поэтому может сравниваться с показаниями одноядерных процессоров, и выводы, соответственно, будут подходить и для них. Без разгона они имеют среднее время SuperPi 1M = 50s (секунд) для частоты около 2000 МГц с некоторой зависимостью от настроек памяти. Поэтому падение вычислительных способностей ядра будем оценивать относительно этого номинального результата. Чем больше время расчёта, тем медленнее работает процессор.
Запуск SuperPi не ставил задачу получения рекордного результата. Не отключались службы интернета и прочие, выключалась только висящая в трее Riva Tuner, не устанавливалась специально новая ОС. Но соблюдались остальные обычные правила запуска этого теста, позволяющие иметь разброс показаний всего 0.2-0.3 с на фоне 1 минуты и 30 секунд, что довольно неплохо, и допускало запуск теста 1 раз. Вот эти правила:
*) выключить (или не запускать) все возможные программы и окна (но не останавливались службы и процессы);
*) после старта Win проходит 1-2 минуты, чтобы движения диска полностью успокоились и не были слышны;
*) перед окончательным пуском теста выжидается 5-6 секунд, когда диск ещё может помешать точной оценке;
*) при работе не трогается клавиатура и мышь.
Если даже соблюсти все формальности, улучшение показаний могло бы быть ориентировочно на 1-2 с, что несущественно для наших сравнений.
Второй инструмент, который покажет достоинства работы 2 ядер в 1 приложении - это 3DMark 2006. Будем смотреть не на суммарный результат, а на результат вычислительного теста в нём (3-е число, CPU Score). Он обычно слабо зависит от видеокарты и материнской платы, и приблизительные ориентиры в нём такие:
Одноядерный Athlon64 без разгона: 700.
Одноядерный Athlon64 с разгоном до 2700М: 1000.
2-ядерный с разгоном до 2500: 2000.
Core2Duo с разгоном до 3-3.2 ГГц: 2800.
Конфигурация.
В экспериментах принимали участие следующие комплектующие:
Процессор: AMD Athlon64 4400+X2 ( Toledo), кеш 1-го уровня - 2 по 64 КБа данных и столько же для инструкций; кеш 2-го уровня вегда отключен, не работающий (номинально 2 по 1024 КБа);
Мат.плата: DFI LP UT NF4 Expert, Bios 6.00 PG (04/06/2006);
Кулер: Thermaltake Big Typhoon;
Память (1 планка): Samsung PC3200U-30331-E0 1GB DDR PC3200 CL3;
Память (быстрая, 2 планки): Geil CL2-2-2 UltraX400 2x512Mb;
Видеокарта: ATI Radeon 2600XT DDR4 256MB;
Диск: Seagate 200 GB IDE;
ОС: WinXP SP2 с пакетами обновлений.
Замечания: благодаря переменной скорости вращения кулера на данной плате, можно было не сильно заботиться об оборотах и охлаждении - при выставлении предела низких оборотов на 40 град в биосе, вентилятор вращался на 2200 об/мин при менее 40 град. и плавно увеличивал обороты до 4800 при 62 град, будучи, однако, тихим. (Установлен без прижима, что ещё бы улучшило показания на 2 град.) При разгоне памяти и питании выше 3.3V понадобилось охлаждение модулей большим замедленным вентилятором размером 80 мм. Диск тоже немного влияет на SuperPi, но система не устанавливалась на быстрый диск, так как не было задачи получения лучших абсолютных результатов. Расположение комплектующих - открытый стенд. Вид стенда в действии:
Данные и процесс разгона.
Будем отображать результаты экспериментов в таком виде (В первой строке установки, во второй - измерения, красным будут выделяться изменившиеся установки.) :
Процессор: частота шины, множитель, напряжение | память: остновные тайминги (дополнительные), CR, дуальность, частотный показатель, напряжение |
Частота ядра процессора, частота и делитель памяти | тесты: SuperPi 1M, SnM не менее 15 мин, 3DMark06 |
Основные тайминги памяти - (Tcl-Trcd-Tras-Trp, CPC), дополнительные - (Trc-Trfc-Trrd-Twr-Twtr-Trwt) или значения Auto, если не отмечаются.
Частоты процессора и памяти читаются в программе CPUz, напряжения пишутся из настроек биоса, не из мониторинга.
3DMark 2006 показывает общий счёт и 3 основных составляющих, главная для процессора из них - последняя (CPU Score).
После удачного старта без кеша 2-го уровня система на медленной (обычной) памяти показала такие результаты:
235M, 11x, 1.275V | 3-3-3-7, 1T, Single ( 140М, 2.7V ОЗУ - bios) |
2530M, 172M ОЗУ | SPi1M=1m39.4s; SnM: работает; 3DM06: 4124(1543,1898,1334) |
Далее, была взята частота FSB:
242M, 11x, 1.275V | 3-3-3-7, 1T, Single |
2661M, 190M ОЗУ | SPi1M=1m35.4s; SnM: ошибки в нагрузке (FPU) |
240M, 11x, 1.275V | 3-3-3-7, 1T, Single |
2640M, 188M ОЗУ | SPi1M=1m35.0s; SnM: работает, 67 град. |
Заменяем память на более быструю. Но, пока не настроены её режимы работы, довольствоваться приходится низкими частотами (В биосе - 140 МГц частоты памяти):
240M, 11x, 1.275V | 2-2-2-5, 2T, Dual, 140 MHz, 3.1V |
2640M, 165M ОЗУ | SPi1M=1m29.0s |
Чтобы сделать следующий шаг разгона, заменяем автонастройки памяти на фиксированные значения. (Тайминги в скобках соответствуют сигналам Trc-Trfc-Trrd-Twr-Twtr-Trwt.)
240M, 11x, 1.275V | 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 150 MHz, 3.1V |
2640M, 175M ОЗУ | SPi1M=1m24.7s |
240M, 11x, 1.275V | 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 166 MHz, 3.3V |
2640M, 188M ОЗУ | SPi1M=1m21.0s |
Следующий режим работал на 3.3 V памяти, но к нему пришлось вернуться и обнаружить, что 3.2 V он тоже поддерживает и проходит 3DMark:
240M, 11x, 1.275V | 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 180 MHz, 3.2V |
2640M, 220M ОЗУ(1/12) | SPi1M=1m15.0s; SnM: работает, 3DMark06: 4632(1681,2158,1547) |
Пробуем уменьшить важный тайминг Command Rate (1Т/2Т):
240M, 11x, 1.275V | 2-2-2-5 (7-12-3-3-2-3), 1T, Dual, 180 MHz, 3.3V |
2640M, 220M ОЗУ(1/12) | SPi1M=1m11.8s, SnM, 3DMark06: с ошибками, не запускается |
240M, 11x, 1.275V | 2-_3_-2-5 (7-12-3-3-2-3), 1T, Dual, 180 MHz, 3.2V |
2640M, 220M ОЗУ(1/12) | SPi1M=1m14.0s, SnM, 3DMark06: с ошибками, не запускается |
240M, 11x, 1.275V | 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 200 MHz, 3.2V |
2640M, 240M ОЗУ(1/11, синхронный) | SPi1M=1m14.0s, SnM: имеет ошибки памяти; 3DMark06: с ошибками, не запускается |
Возврат к 3.3V на памяти частично решил вопрос правильной работы в тестах. Правда, пришлось ещё ставить несильный обдув памяти 80-мм вентилятором, иначе ошибки начинались где-то на 3-й минуте работы. SnM: работает, темп. в тесте процессора - до 67 град., 3DMark06: не запускается графика (после загрузки первого сэмпла). Повышение до 3.4 V эффекта с 3DMark не изменило (переход на 2-3-2-5 тоже, понижение частоты FSB до 236 - тоже; точнее, система стала виснуть на этой точке; на FSB=232 М картина не изменилась, а SuperPi вырос до 1m14.7s, что близко к 1m15.0s из настройки с последним работающим 3DMark), а жаль - хорошая скорость работы памяти сильно сказывается на вычислительной мощности сейчас. Возможно, подстройка второстепенных таймингов помогла бы в работе, но заниматься этим не имеет большого смысла - способности системы оцениваются, а не настраиваются для работы. (Впоследствии было обнаружено, что увеличение одного Tcl до 2.5 решил вопрос с разгоном до 240 без ошибок.)
Незапуск 3DMark - указание на то, что система неполноценна, но даже если бы мы добились работы в нём, он тоже не проверяет все ошибки. Если бы была возможность позапускать несколько игр и прокомпилировать сложный проект - сумма таких тестов сказала бы почти гарантированно о стабильности, но пока этого не требуется, система на открытом стенде. Будем считать, что система стабильна на предыдущем полноценном измерении:
240M, 11x, 1.275V | 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 180 MHz, 3.2V |
2640M, 220M ОЗУ(1/12) | SPi1M=1m15.0s, SnM: работает; 3DMark06: 4632(1681,2158,1547) |
Такие или немного лучшие показания зафиксированы на скриншоте.
240M, 11x, 1.275V | 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 180 MHz, 3.2V |
2640M, 220M ОЗУ(1/12) | SPi1M=1m14.8s, SnM: работает; 3DMark06: 4610(1678,2142,1542) |
Сравним ещё разницу между одноканальным и 2-канальным режимами памяти, вынув одну планку.
240M, 11x, 1.275V | 2-2-2-5 (7-12-3-3-2-3), 2T, Single, 180 MHz, 3.2V |
2640M, 220M ОЗУ(1/12) | SPi1M=1m22.5s, SnM: работает; 3DMark06: 4461(1629,2067,1492) |
Уменьшение общего счёта 3DMark06: 3.6% (1-1492/1547).
Уменьшение счёта CPU Score в 3DMark06: 3.6% (1-1492/1547).
Наконец, приведём показания марков в неразогнанном режиме.
200M, 11x, 1.275V | 2-2-2-5 (7-12-3-3-2-3), 2T, Dual, 200 MHz, 3.0V |
2200M, 200M ОЗУ(1/11) | SPi1M=1m25.3s, SnM: работает; 3DMark06: 4319(1615,2040,1319) |
Дополнение от 25.06.2008. С кулером Zalman CNPS9700 Cu и 2 вентиляторами на нём (ради неповышения шума) вот что удалось получить:
253M, 11x, 1.275V | _2.5_-2-2-5 (7-12-3-3-2-3), 2T, Dual ( 180М, 3.0V ОЗУ - bios) |
2861M, 232M ОЗУ(1/12) | SPi1M=1m12.3s; SnM: работает; 3DM06: 4684(1688,2171,1609) |
Для наглядности результатов сведём полученные данные бенчмарков в таблицу. (Читатели хотят зрелищ, надо что-то придумать.) Имеем 4 приблизительных значений скоростей разных процессоров в обоих бенчмарках и 4 измерения исследуемого процессора в разных режимах. Расстановка их в ряду гистограммы вполне показывает достигнутое, и можно переходить к выводам. С одной оговоркой: чтобы наглядно показать быстродействие при вычислении SuperPi, была взята шкала по формуле 100000/SuperPi1M.
Выводы.
Выводы получились богатые и многоплановые. На процессор посмотрели под другим, нетрадиционным углом. Сразу открылись несколько любопытных фактов.
1) Процессор с отключённым внешним кешем может полноценно использоваться _ для временной замены другого процессора_ в случае его отсутствия и даже полноценно работать в компьютере, создавая лишь некоторое замедление общей работы (в худшем случае - до 40% от номинальной скорости базового исправного процессора).
2) Отключение кеша благотворно сказывается в _ понижении напряжения на ядре_ (надо проверить вывод - возможно, это из-за ядра Toledo, но по логике, потребление хотя бы уменьшается). Следовательно, возможен разгон до больших частот, чем с кешем. Следствие - возможно "не совсем честное" достижение рекордов разгона по частоте. Но повышение частот и понижение тепловыделения также немного компенсирует потерю производительности при отключении кеша, если сравнивать не равные частоты, а предельные для разгона (на воздухе, где критично тепловыделение) в том и другом случаях.
3) Видимо, процессор с отключённым кешем допускает _ несколько больший разогрев_. Во всяком случае, для данного экземпляра была рабочей температура (точнее, её показатель в тесте) 67 град, в то время как процессоры 3200+ на этой же плате обычно зависали при более 60 град. Доказать это сможет эксперимент с исправным процессором с намеренно отключаемым кешем. Если это так, то отключение кеша - ещё одно основание для получения экстремального разгона с ограниченным охлаждением.
4) Конечно, _ выбор быстрой памяти_ и её разгона сильно сказывается на вычислительной скорости такого процессора. Если считать 50 секунд в SuperPi 1M "мечтой" бескешевого процессора в достижении минимальной полноценности неразогнанного A3000+, то в экспериментах с памятью DDR440, 2-2-2-5, он отстаёт от неё всего на 30% (1-50/72). Количественно, улучшение памяти дало прирост: 95(s)/75 - на 26 %, что значительно больше, чем обычные результаты с кешем (конечно, в данном случае попался ещё удачный результат работы теста на частоте памяти 220 МГц, а первое число получено в режиме Single Channel). Если память такая будет значительно дороже (например, на стоимость исправного процессора), то гнаться за ней нет смысла. Она будет полезна, если окажется "под рукой".
5) Использование двухканальной памяти будет эффективнее, чем у процессора Athlon64 с кешем (у которого средний прирост в SuperPi - 6%). Выигрыш - 10%. Не во всех вычислениях это так заметно. Например, по тесту Cpu Score в 3DMark06 ускорение - на 3.7% (1547/1492-1), как, впрочем, и увеличение общего счёта теста (3.6%).
6) Разгонять частично исправный процессор можно, стабильность тестов от этого не страдает.
Результаты показывают, что даже по тестам SuperPi, имеющим интенсивный обмен с кешем, процессор стал лишь немного отставать от стандартного 3000+ без разгона. Это значит, что и при самых тяжёлых для отсутствия кеша вычислений он будет не сильно проигрывать нормальным Атлонам (конечно, за счёт полученного разгона и быстрой памяти), а в двуядерных работах будет превосходить их. Общий вывод: если попадётся такой процессор как альтернатива одноядерному, то, скорее всего, он удовлетворит пользователя (по крайней мере, как временное решение). Если без кеша окажется одноядерный процессор - отставание в вычислениях будет 25-50%, что терпимо, но отставание от разогнанного одноядерного с SuperPi порядка 35с будет раза в 2-2.5, что может устроить лишь временно. Потому что будут наблюдаться "странные" замирания вычислений на привычных простых вещах: архивация, декодирование, рендеринг, игровые обсчёты, и система будет вести себя немного иначе, хотя среднее замедление вряд ли будет больше 50%.
Обсудить статью или сделать замечания, дополнения, ссылки, прошу здесь: Статья "Разгон 2-ядерного процессора AMD с неисправным внешним кешем"
реклама
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Сейчас обсуждают