Компьютер сноба-потребителя за 2013 год, часть вторая.
реклама
Компьютер сноба-потребителя за 2013 год
Часть 2.
(продолжение)
Кулер не моей мечты.
Дайте мне высокий, тяжелый кулер
И я им вам из платы выверну кусок
Архимед. Начала нано-философии.
А сегодня мы поговорим о тишине. Мы с вами живем в эпоху нанотехнологий, в это светлое и прогрессивное время я почему то вылез тут с какими-то 286-ми допотопными процессорами. Это неуместно. Лучше поговоим о современности, о тишине. Как это прекрасно, когда ваш компьютер не заглушает своим ревом идущий на взлет реактивный самолет!
Вспоминаю я всегда при этом поводе старые компьютеры, которые были исключительно тихими. Иногда я даже думаю, а за все это время вообще чего-нибудь делалось в процессоре, кроме как повышение допустимой рассеиваемой мощности? Какой реальный прирост мощности по сравнению с 286 процессором был сделан, если ограничить потребляемую мощность теми же значениями, как 286? Останутся ли те же "сотни тысяч раз быстрее"? Не превратятся ли они в "сотни тысяч раз прожорливее"?
Этот вопрос интересный, но мы его рассмотрим практически, утилитарно - пусть современный компьютер делает вид, что он потребляет мало, другими словами, мы попытаемся максимизировать работу процессора при таком ограничении, как минимальный шум. Проведем такое нано-научное исследование.
Содержание
1. Меняем кулер на FX-4100 (система охлаждения из бумаги).
2. Работа FX-4100 со штатным кулером (Интел против АМД).
Меняем кулер на FX-4100.
Немного теории.
Что надо чтобы охладить процессор без лишнего шума?
В общем надо иметь большую площадь поверхности, которая отдает тепло. Значит радиатор должен быть большим. Чем больше тепла надо отвести от процессора, тем больше будут геометрические размеры радиатора. Самый известный способ увеличения площади поверхности в равном объеме это множество параллельных пластин - радиатор. Общая площадь теплоотдачи радиатора с равными пластинами равна числу пластин умножить на два и на площадь каждой пластины.
Значит, чем больше пластин, тем лучше теплоотдача? Неа. Проблема в том, что к каждой пластине надо подвести холодный воздух и отвести горячий. Любой старый радиатор на большой транзистор это просто вертикальная пластина. Горячий воздух идет вверх, холодный подсасывается сбоков. Конвекционное охлаждение. Иногда таких пластин ставят несколько. Чтобы ускорить теплообмен воздух на такие пластины иногда гонят принудительно, вентилятором.
Не вникая в тонкости движения потоков воздуха и их влияния на теплоотдачу можно сказать, что в определенных границах, чем меньше расстояние между пластинами, тем выше сопротивление потоку воздуха, который гонится от вентилятора. Сопротивление потоку имеет решающее значение. Течение воздуха подчиняется тем же правилам, что и электро ток. Если у вас есть несколько путей, один из которых трудный, а другой легкий, почти весь воздух обязательно пройдет по легкому пути.
Что может вызвать сопротовление потоку? Самые неожиданные вещи. То, что является оптически прозрачным не обязательно будет аэродинамически прозрачным. Например, попробуйте подуть вентилятором от блока питания на другой такой же вентилятор, который подключен или не подключен к питанию соединив их без зазоров, попробуйте вдувать вентилятором в трубку или выдувать из нее с некоторого расстояния или прислонив. Попробуйте подуть на/из марлю или более крупную сетку с некоторого расстояния от нее.
К чему может привести появление неожиданного сопротивления потоку в нашем случае? К тому, что наш воздух не пойдет через радиатор. Он будет лезть из всех дыр, но только не продувать радиатор.
Второй момент это тепловой контакт между радиатором и процессором. Неровности соприкасающихся поверхностей приводят к тому, что между ними остаются мельчайшие воздушные пузыри. А воздух плохо проводит тепло, через него проходит только излучение, а излучение переносит очень малую долю энергии по сравнению с прямым контактом теплопроводящих веществ. Также на поверхностях скапливаются разные загрязнители. Иногда прямой контакт между некоторыми материалами может быть затруден, вероятно силами молекулярного отталкивания. Поэтому с воздухом, грязью и несродством материалов борьбу ведут путем очистки поверхностей и нанесения теплопродводной пасты. Паста может быть и плохо проводит тепло относительно меди, но много лучше чем грязь или воздух, поэтому ее слой должен быть и не тонким, и не толстым.
Качество пасты конечно играет большую роль в охлаждении, но даже применение такой как КТП-8 в большинстве практических случаев приводит к тому, что температура радиатора в точке контакта не отличается от температуры крышки процессора более чем на пару градусов во всем диапазоне температур.
Имея такие сведения, когда вставал вопрос о приобретении кулера, я остановил свой выбор на тех из них, которые имеют высокие радиаторы. Чем выше, тем лучше, лишь бы в корпус влез.
Рассмотрим кулер Титан "TTC-NK35TZ/RPW/V3" который сразу соблазнил меня своим малым весом, огромными габаритами, уникально низкой ценой и наличием для продажи (все это конечно по сравнению с его собратьями, другими кулерами). Не гонялся бы ты сноб, за дешевизной! Некоторые сомнения у меня сразу вызвала плотная решетка радиатора, но я решил, что "придумаем как ее продуть, если что".
Штатный регулируемый вентилятор немедленно завыл на всем диапазоне оборотов, его пришлось поменять на такого же размера обычный нерегулируемый тихой модели от блока питания. Это возможно, потому что на ATX формфакторе ASROCK предоставляет аж три регулируемых источника напряжения (неизвестно какого максимального тока), так что регулировать вращение почти удобно. Купить вентилятор, который бы не шумел на малых оборотах становится все сложнее и сложнее, прогресс не стоит на месте.
У всех высоких кулеров есть проблема - даже малый вес помноженнный на большой рычаг дает достаточно большой момент, отрывающий верхний край кулера от процессора, который стоит в корпусе вертикально. Упругое крепление к сокету АМД обладает многими достоинствами, но с такими ситуациями не справляется. Производители плат под АМД должны просто сами позволять крепить кулера от Интел 1156/1155 на процессор АМД, которые у Интел крепятся жестко на винтах.
Почему я решил сменить этот кулер Титан на штатный от АМД?
Потому что я, проводя очередную ревизию компьютеров обнаружил, что периодически этот кулер взревывает, набирая обороты. Как так? Почему? Непорядок. Надо выяснить. Открыл я корпус и полез выяснять.
Первая мысль была о том, что радиатор на малых оборотах не продувается. А он действительно не продувается, частое расположение пластин создает столь высокое сопротивление потоку, что малый напор через весь кулер практически не проходит, также пластины открыты с трех сторон и между пластинами и кулером есть дыры, что приводит к тому, что весь задуваемый на вентилятор воздух вылетает через эти дыры и ближайшие края пластин. До дальнего края пластин воздух почти не доходит. Но прежде чем создавать кожух, я решил проверить кулер под нагрузкой.
Нагрузил процессор тестовой работой. Вентилятор разогнался. Смотрю на датчик температуры - на процессоре 60, трогаю радиатор - холодный, градусов 25! Что такое, думаю. Лезу рукой к основанию радиатора - там все 60 градусов.
Оказалось, что на радиаторе высотой в 10 см разница температур между площадкой контактирующей с процессором и верхними пластинами радиатора может составлять 40 градусов. Другими словами, вентилятор можно совсем не разгонять, он мало влияет на охлаждение процессора.
Кулер Титан "TTC-NK35TZ/RPW/V3" открыл мне дополнительное требование к радиаторам, которое я считал выполненным всегда - тепловое сопротивление внутри длинного радиатора сложной конструкции должно быть минимальным так, что весь радиатор при обдуве должен иметь примерно одинаковую температуру. Для этого теплообмен между обдуваемой и необдуваемой частями радиатора должен быть достаточным, чтобы передать всю мощность, выделяемую процессором.
За перевод тепла отвечают тепловые трубки, выглядящие "под медь". Я не знаю что это за медь, но ее количества явно недостаточно, чтобы передавать тепло ко всем пластинам. Малое количество максимально передаваемого по радиатору тепла вместе с частым расположением пластин, которые надо продувать очень сильным потоком довольно странное конструктивное сочетание - плохо охлаждает, при этом сильно шумит. Очередной некачественный продукт.
Вообще, по хорошему длинный радиатор ничем не оличается от короткого, кроме числа пластин или их размеров. Витиеватые конструкции из тепловых трубок может и пригодны для охлажения чипсетов на матплате, но это явно не для лишних десятков ватт процессора.
Итак, встал вопрос о смене радиатора, а поскольку у меня уже валялся без дела штатный кулер от боксового FX4100, я решил его запользовать.
Никаких особенных чудес я от него не ждал, но штатный кулер короткий, а значит весь может обдуваться и отводить тепло от процессора. Этот кулер уже участвовал в испытаниях процессора сокет FM2, которые тот процессор благополучно провалил. Не знаю насколько мне неповезло с экземпляром процессора FM2, но от неизвестных изделий АМД это меня определенно отпугнуло.
Посмотрите на этот кулер от АМД, насколько часты его ребра, обдувать его малым потоком сложно.
Вот для сравнения ребра старого радиатора Титан
Еще для сравнения кулер от i3 неведомого производителя. Сравните расстояние между ребрами, размер радиатора, неподвижность относительно процессора, размер вентилятора. Крепление АМД на хомутике затрудняет изготовление хорошего радиатора, но производители маплат непонятно почему не позволяют устанавливать радиаторы от Интел.
Замена кулера заняла пару минут.
В качестве термопасты я использовал "нано-теплопровод" (там так написано) от этого кулера Титан "TTC-NK35TZ/RPW/V3"
Эксплуатация в течении пары дней (см. следующую часть) показала, что помимо шума, который создает штатный вентилятор, он еще и дует во все стороны (старый кулер дул строго в сторону задней стенки, где горячий воздух подхватывался блоком питания). Поскольку в этом корпусе нет задувающей трубки над процессором,
температура внутри корпуса за большое время растет так, что кулер просто начинает гонять через радиатор тот же самый горячий воздух.
Я решил снизить производительность до 2500МГц и принципиально уложится в 60 градусов и тишину. Эти 2500МГц крайне негативно отражаются на производительности подсистемы памяти, которая у АМ3 и так то едва дышит, а тут совсем снижает скорость. Самое интересное, что это все не помогло. Два потока на частоте 2500МГц все равно загоняют процессор за 60 градусов.
Пришлось не только сменить вентилятор, прикрепив тихий от блока питания,
но и задействовать дополнительный вытяжной вентилятор на задней стенке. Дополнительный вытяг на 10% оборотов не помог, тогда я переменил направление вращения на вдув. Нет эффекта. Температура нагруженного проца растет с 57 до 62 при закрывании стенки за минуту. Пришлось увеличить скорость вентилятора до 20%, затем до 30%. На 30% уже слышен шум воздуха, а на 20% нет охлаждения.
Тогда я пошел по пути халтуры и сделал из листа бумаги формата А5 воздуховод так, чтобы входяший вентилятор дул на кулер сверху бумаги, а отработанный воздух из под низа бумаги выдувался бы блоком питания, который тоже дует на 10%. Бумажку закрепил за ребра вентиляторов за счет собственной жесткости бумаги. Никакого эффекта, т.е. температура растет медленней, но все равно растет, минут за 10 вентилятор обязательно разгонится, чтобы охладить корпус.
Пришлось отключить второй модуль процессора, а значит рисковать периодическим пропаданием переключений S-состояний. После отключения второго модуля 30 минутный запуск двухпоточной нагрузки прошел в тишине и покое. Но эти 2500МГц не только ухудшают работу с памятью, но и все вычисления работают заметно медленно. Пришлось задействовать PSCHECK, чтобы модифициировать таблицу P-состояний процессора "на лету". Смысл модификации в подборе P1 состояния между 2500 и 3600 МГц и максимально низком питании. Батник вызывается вручную перед особыми приложениями (я поместил его в панели задач), но это не гарантирует, что иногда состояние не будет перегружено из BIOS.
При использовании PSCHECK я остановился на режиме 3200МГц и питании 1.2В, 30 минутный запуск двухпоточной нагрузки прошел без перегрева. Наконец-то компьютер стал неслышен за дневным шумом, к тому же по сравниню с 2500МГЦ выросла скорость работы с памятью.
Я пробовал отключать вентилятор на i3. Каким бы энергоэффективным он не был, без минимального обдува i3 также уходит в нагрев, значит хорошие пользовательские качества i3 показывает еще и за счет удачного радиатора и того, что в том корпусе есть задувающая трубка над процессором.
Как решить проблему? Производитель плат на АМД сокеты должен зарезервировать место и пробурить в плате 4 дыры, чтобы допускать опциональную установку кулеров, аналогичных i3, для тихого компьютера с несколькими модулями АМД альтернативных вариантов нет. Крепеж кулера АМД хоть и традиционный, но явно не выдерживает новые 100 ватные процессоры, крепеж кулера АМД годится только для младших моделей процессоров АМД или Интел, поскольку появился он в то время, когда процессоры рассеивали до 30 ватт.
Каким же должен быть кулер, чтобы называться хорошим?
радиатор должен:
- сидеть на процессоре плотно, не отклоняться под своим весом;
- прикрепляться к специальному креплению-накладке, а не выворачивать куски из платы;
- допускать смену вентилятора без отсоединения от процессора;
- иметь малый вес и большую площать поверхности (большое число ребер заданной площади поверхности);
- иметь расстояние между ребрами достаточно большое, чтобы его можно было продуть малым потоком, почти конвекцией;
- иметь конструкцию при которой малый поток обдувает все части ребер радиатора, без мертвых зон;
- иметь низкое внутреннее тепловое сопротивление, чтобы весь радиатор имел примерно равную температуру;
- быть достаточно крупным, чтобы рассеивать на малом потоке работу "не топового" процессора (30,60,90 ватт);
вентилятор должен:
- выдувать наружу корпуса (дуть в определенном направлении корпуса, а не "вообще дуть") или задувать снаружи;
- не шуметь по крайней мере на малой скорости вращения.
В общем радиатор прикрепляется к процессору один раз и на долго, а вентилятор сменяется по мере износа (ну, кулер для тестов процессоров работает наоборот, однако для него нет вообще никаких условий, кроме чтобы охлаждал).
Разгон FX-4100 со штатным кулером.
Об Интел процессоре на плате MSI поговорим позже, там много чего интересного; а пока продолжим пытать FX-4100 (как я выяснил, это Black Edition) на AsROck-е 880g Pro3, рассматривая итоги двух лет эксплуатации.
а) Отличается ли "два ядра на модуль" от АМД от Интел "гипертрединг"?
Да.
Как удалось установить, по перемалыванию чисел в L1 кэше, "два ядра на модуль" АМД дают ускорение модуля на двух потоках на 60% по отношению к одному ядру (5600 против 3500); при этом пиковая производительность теряется на 20% (2800 против 3500); это значит, что по крайней мере некоторые исполнительные модули в FX процессоре действительно есть в двух экземплярах (проверка заявленных АМД характеристик вещь обязательная).
Для сравнения, "гипертрединг" Интел дает ускорение ядра на двух потоках на 25% по отношению к одному ядру (3900 против 3100); при этом пиковая производительность теряется на 40% (1950 против 3100).
Получается, что "два ядра на модуль" АМД идеально?
Нет.
Во-первых, в обоих случаях теряется пиковая производительность и даже 20% это много.
Одна из связанных с этой потерей неприятностей в обоих случаях такова, что запуск в работающей системе новых процессов того-же уровня привилегий вызывает их установку на втором потоке, а в результате получаем падение производительности текущих процессов на первом потоке. Если это сервер, то это без разницы, в обоих случаях в сумме потоки выполнятся не хуже, чем на ядре без этой функции; но если это игра, в которой первый поток загружает ядро на пределе производительности, то равномерность работы игры начнет отображать число запущенных в системе процессов в реальном времени, т.е. даже визуализация в играх с большим числом персонажей начнет то ускоряться, то замедляться, в зависимости от числа работающих в данный момент в системе процессов.
Практически это заметно на процессорах с малым числом модулей (один,два), поскольку типовая двухъядерная игра может занять их все.
Как кажется это проблема только планировщика процессов в конкретной операционной системе; на процессорах с такими функциями такие задачи должны иметь атрибут "не делить ядро", что позволит динамически повышать приоритет активного процесса и не давать изначально равноприоритетным задачам (обычно в системе большинство задач имеют один приоритет "умолчательный") вставать во второй поток.
Даже "ядра АМД" в операционной системе не могут представляться системе равными, только как одно ядро на два потока (чтобы не вводить новые термины "модуль_АМД/ядро_АМД", против "ядро_Интел/поток_Интел"), поэтому если вы еще не установили патч от Майкрософт различающий ядра АМД от модулей АМД, есть смысл это сделать.
Во-вторых, банкет увеличения на 60% многопоточной производительности у АМД проводится за чей-то счет, а именно, за счет избыточно потребленного электричества.
Сейчас проверим.
Разгоним процессор до 4.5ГГц, включим в BIOS режим "одно ядро на модуль" и загрузим оба ядра работой теста, не прошло и двух минут как кулер пытается взлететь, а температура процессора достигла 65. Кулер работает на полных оборотах пару минут, но температуру ниже 60 все никак снизить не может. Разгон на высокой температуре никогда не будет стабильным, а наш кулер от АМД не справляется с таким разгоном, даже когда часть процессора уже не работает.
Выключим одну задачу и наш процессор ушел ниже 60 градусов и кулер затих на 10% (на сколько этот кулер вообще может затихнуть). Резерв работы для разгона одного модуля еще есть, но охлаждать даже два потока нечем уже сейчас. Это был вариант "два честных (однопоточных) ядра АМД". Два потока теста, каждый поток показывает равную производительность, совпадающую с однопоточным тестом.
Теперь надо в BIOS включить два ядра уже в одном модуле, а потом посмотреть на тепловыделение и производительность. Теоретически должны получить очень маааленькую потерю производительности с очень бооооольшим выигрышем в тепле.
Перезагружусь, проверю и продолжу запись.
...
Загрузим оба ядра работой. Даже надоело ждать. Проходит около 10 минут, процессор переваливает за 60 кулер включается и стабилизирует его на 60 на повышенной скорости (процентов 20%). Поскольку алгоритм управления кулером упрощенный, то если сразу задать эти 20% вращения, процессор не перевалит за 60 и кулер не начнет периодически разгоняться/замедляться (в диапазоне 58-63 градуса).
Экономия энергии по сравнению с двухмодульным однопоточным вариантом впечатляющая, на такой частоте или очень близкой процессор сможет никогда не шуметь. НО:
- Эти 60 градусов это само по себе очень много. Для сравнения, включение/выключение гипертрединга Интел на "стрелку амперметра" заметно не влияет, по крайней мере более чем на 10% (погрешность измерений); главное, что это никак заметно не влияет на температуру, которую надо рассеять кулером на 10% оборотов, не влияет на температуру держащуюся на отметке ниже 50 градусов, при этом повышая производительность до 20% практически бесплатно. Пока я это писал, кулер опять ускорился, примерно на три минуты, пауза две минуты.
- В результате, разгон модуля с двумя потоками приводит как к падению производительности при двух потоках (2800 против 3500), так в нашем случае и к небольшому превышению порога в 60 градусов; заметим, что производительность 2800 соответствует АМД 3.5ГГц, а на такой частоте два потока в разных модулях дают температуру менее 60 без ускорения вентилятора очень долго, десятки минут.
Другими словами, два работающих потока в одном разогнанном модуле АМД дают нам одновременно как нагрев и шум, так и низкую многопоточную производительность, которую легко можно достигнуть тем же АМД с двумя однопоточными модулями на более низкой частоте, но уже без нагрева и шума!
Единственно, когда оправданы два потока в одном модуле АМД, это когда у вас существенно однопоточная нагрузка и процессор для одного потока можно сильно разогнать на данном кулере, а когда появляются два потока, они тоже смогут выполняться быстрее чем на однопоточном ядре и выделяя чуть больше тепла, чем два отдельных эквивалентных низкочастотных однопоточных модуля. Плюс универсальность, плюс возможность выполнить один поток быстро, минус чуть больший выход тепла.
Преимущество быстрого выполнения одного потока на одном модуле чисто теоретическое, поскольку типовая игра потребует два постоянных потока. Включение же двух модулей даже с одним потоком, как мы убедились в предыдущем примере, в нашем случае сразу снижает частоту до штатной, процессор становится нечем охлаждать.
Получается, что сама по себе архитектура принятая в двухпоточном модуле АМД имеет может быть упрощенную схемотехнику, но плохую энергоэффективность, технология эквивалентна "отключению второго потока в пользу ускорения первого потока", что легко достигнуть отключением второго ядра и турбо-бустом первого с большей энергоэффективностью, поскольку работа разных ядер в двухпотоке на низкой частоте холоднее, чем работа одного ядра с двумя потоками на высокой частоте с такой же производительностью. В нашем случае отсутствие энергоэффективности выливается в то, что процессор становится нечем охлаждать.
Гипертрединг Интел, тоже в каком-то роде являясь схемотехническим упрощением, под эти ограничения не попадает. Не попадает потому, что у гипертрединга иная идеология. Цель гипертрединга не дублировать, а задействовать неиспользуемые параллельные исполнительные модули ядра за счет перемешивания попеременного выполнения нескольких потоков. Гипертрединг не работал бы вообще (за исключением наложения фаз выполния и смены контекста, что работало бы и тогда), если бы компиляторы создавали идеальный код и система команд x86 позволяла бы такой код исполнять. Поскольку реально код не идеальный, перемешивание может дать преимущество (случайное совпадение в двух потоках вычислений, которые можно выполнить одновременно) и как показывают тесты, на практике ускорение до 25% не более чем за те же 25% роста затрат энергии, т.е. гипертрединг похоже энергоэффективность заметно не ухудшает.
В гипертрединг теоретически можно объединить и больше чем два потока, если код совсем неэффективный. Интел называет выполнение потоков "конкурентным", на деле потоки просто выполняюются по очереди (так показывают тесты, они показывают полное отсутствие неравномерности вычислений, вызванной захватом блоков одиним более эффективным процессом за любой малый измеримый промежуток времени). Поскольку Интел компания буржуазная, в ней все знают что конкуренция это хорошо, Интел, положим, с конкуренцией борется, ну здесь это не важно, главное что они догадываются что это хорошо, поэтому поочередный порядок был на страх врагам назван конкурентным, так Интел изобрела свою версию нано-штанов. Альтернатива поочередному выполнению - приоритетное, когда один поток основной, а другой вспомогательный и вспомогательный получает выполнение только в свободное от основного время. Приоритетное выполнение позволяет ставить в гипертрединг задачи с разным приоритетом, т.е. не снижать пиковую производительность основного потока, но это ухудшает рост производительности от совместного выполнения.
Архитектура принятая в двухпоточном модуле АМД была бы оправдана, если бы повышение производительности было бы не меньшим, чем потери энергии от дублирования исполнительных модулей, т.е. если бы АМД построила гипертрединг, и проведя исследования, сдублировала бы только самые используемые и малопотребляющие модули, то может быть им и удалось бы совместить энергоэффективность гипертрединга Интел и повышенную производительность двухпоточных модулей АМД. Бы.
Еще раз подчеркнем философские отличия гипертрединга Интел от модуля АМД: Интел считает, что для x86 исполнительные блоки уже на одном потоке "нечем кормить", поэтому обвешивает вычислительную часть дополнительным контекстом (он хранит состояние), делит одну шину пополам для дополнительного потока команд и данных, который поставляет более разнообразный корм; АМД напротив, увеличивает число исполнительных блоков, фактически, АМД создает два ядра, самые "тяжелые" части которого общие (используются по очереди, как гипертрединг), а самые "легкие" раздельные (используются как независимые ядра).
Вопросы такие: как АМД собирается кормить два простых ядра "по одной шине как по двум" и как АМД собирается эффективно занимать простаивающие без гипертрединга в каждом потоке исполнительные блоки?
Чтобы ответить на вопрос удалось ли это АМД надо смотреть на достаточно подробную структурную схему процессора с модулями АМД. Без такой схемы можно только гадать и ставить опыты.
Погадаем. Первая загвоздка это "по одной шине как по двум". На первый взгляд сделать это можно только не используя половину пропускной способности шины при работе одного потока, например, гнать по шине ddr типа половину данных либо расширить шину. При этом либо частота ddr шины будет завышена от номинала (это потери энергии как миминум на двух потоках), либо ширина шины будет завышена от номинала (потерь не больше чем при отключенном обычном ядре, т.е. нет потерь). Допустим АМД уширила шину (две независимые шины). Вторая загвоздка это "простаивающие без гипертрединга исполнительные блоки каждого потока". Будем считать, что эта задача в АМД не решается, у Интела тоже много упрощенных моделей процессоров без гипертрединга (i5 от i7, pentium и celeron от i3).
Значит, сама по себе идея двухпоточного модуля, объединяющего гипертрединг для тяжелых вычислений и двухядерность для легких вычислений не порочна в энергетическим плане. Но какова ее реализация у АМД? Систему уравнений, которую легко записать в аналитическом виде может оказаться не просто решить на компьютере в конкретных числах. Здесь такая же ситуация, удалось ли АМД решить задачу в числах?
С другой стороны, идея двухпоточного модуля означает, что для легких вычислений часть блоков будет простаивать. Что если ввести гипертрединг и для них? Получится один модуль, два ядра, четыре потока. Пиковая производительность четырех потоков для тяжелых вычислений будет совсем плохая, одноядерная, но для легких вычислений это аналог Интел i3. Если бы Интел создал процессор с двухпоточным модулем такой схемы, то это был бы i3, у которого тяжелые вычислительные блоки были бы общими на два ядра, вот и вся разница от реального i3. Такой процессор может быть и годится для SOHO применений. Что бы выгадал при этом Интел в плане цены и энергии? Размер кристалла? Сравните с тем что получилось при равной технологии у АМД.
Продолжим ставить опыты.
Проведем доказательный эксперимент, установив в BIOS два ядра в разных модулях и снизив частоту до 3.5ГГц. Мы ожидаем на двухпотоке результат лучше (меньше потребление при равной производительности), чем двухпотоковый модуль на 4.5ГГц.
Если бы BIOSы компании AsRock правильно поддерживали турбо-буст процессоров АМД, и если бы турбо-буст процессоров АМД мог бы разогнать процессор до 4,5ГГц на одном потоке и снизить до 3.5ГГц на двух, то сравнение с двухпоточным ядром можно было бы провести полным, а так мы довольствуемся только работой двух потоков на низкой частоте, турбо-буст на этой плате нормально не работает. Также не работает регулировка Core Voltage от опции профиля питания "разрешить состояние снижения питания", если включено энергосбережение, то опция всегда включена, незавивимо от настроек (напряжение питания процессора всегда снижается).
Мы таки нашли применение двухпоточным ядрам АМД - если на вашей плате по причине низкого качества софта (фирмваре) или ошибок в процессоре АМД не работает турбо-буст от той же АМД, то двухпоточные ядра АМД работают всегда и готовы заменить турбо-буст. Замечательно.
Разница при отключении модулей от отключении потоков это уменьшение количества работающего L2 кэша, но мы это пока не рассматриваем, потому что общая плохая работа памяти на процессорах АМД для сокета АМ3/3+ необъяснима и печальна.
Перезагружусь и продолжу запись.
...
Загрузим оба ядра работой. Надоело ждать. 55 градусов за 10 минут. Лучше, чем один двухпоточный модуль на 4.5ГГц.
Доказали, получили на двух потоках меньше потребление при равной производительности.
Увеличим частоту до 4ГГц.
Перезагружусь и продолжу запись.
...
Колебания работы вентилятора как и для опыта с одним двухпоточным модулем на 4.5ГГц, двухпоточная производительность сейчас выше, а однопоточная была выше тогда.
Итоги.
Если на вашей плате софт и турбо-буст АМД для процессора типа FX 4100 работают нормально (мне такие неизвестны), то подходящий вариант настройки для моего случая (комбинация конкретных экземпляров процессор, кулер) был бы примерно такой:
1 поток 4.5ГГц 1.48В (или выше)
2 потока 3.0ГГц 1.1В (или ниже, потоки распределены по двум модулям АМД)
3 потока 2.5ГГц 1.1В (или ниже)
4 потока 2.5ГГц 1.1В (или ниже)
штатный кулер под полной нагрузкой будет давать 10%-20% оборотов
Для моей платы мне пришлось
- включить умолчательный QnQ (энергосбережение);
- включить умолчательный турбо-буст;
- выключить управление активными ядрами (поскольку ASROCK не умеет управлять активными ядрами, не конфликтуя с режимами энергосбережения).
Еще управление активными ядрами ASROCK вида "только одно ядро в каждом модуле" представляет системе процессор имеющий только 1х64К и 1х2048К кэша, также же как при режиме "только один модуль", что неправильно (режим "только один модуль" в BIOS называется "two cores").
Также я не могу использовать настройку частот и напряжений процессора, поскольку ASROCK не умеет настраивать таблицу P-состояний процессора АМД, только состояние P0 может быть изменено и только в пределах от P1 до Pb0, допустимы только множители 17, 17.5, 18 (18 множитель по умолчанию), иначе не работает QnQ в Windows 7.
Программа АМД PSCheck позволяет контролировать параметры P-состояний процессора и слегка модифицировать их в тестовых целях. Эта программа не может ни заменить BIOS, ни интегрироваться в алгоритмы работы Windows 7 с процесорами АМД, поэтому в обычной эксплуатации неприменима.
После этого конфигурация работы процессора осуществляется динамически через профиль питания Windows 7, параметры
-политика усиления производительности процессора (буст) 100%
-максимальное состояние процессора 100%
-максимальное число ядер 100%
Например, переход в состояние P1 (3300МГц по умолчанию) и включение режима аналогичного "только одно ядро в каждом модуле" достигается установкой параметров
-максимальное состояние процессора 99%
-максимальное число ядер 50% (патч Майкрософт различающий ядра и модули АМД установлен)
(Вот пример работы 50% в режиме "только одно ядро в модуле")
Поскольку управление активными ядрами ASROCK задействовать в повседневной работе нельзя, именно такой режим является для меня основным при стандартном кулере АМД работающем на 10% оборотов.
б)Так может ли АМД тягаться с Интел?
Нас, как пользователей, мало волнует судьба АМД как таковой, однако поставщик более-менее современных процессоров не может быть только один Интел, это прямая угроза нашему благополучию. Пока единственный заметный противовес Интелу это только АМД. Исходя из этих соображений можно сказать, что за пол цены Интела (соотношение типа 60$ АМД, 120$ Интел), АМД может дать пол производительности Интел, при этом изделие от АМД не будет иметь потенциал энергоэффективного разгона, будет иметь плохое фирмваре для обслуживания процессора и будет иметь множество других минусов.
С шумом и грохотом АМД можно поразгонять если уж припрет, но достигнуть возможностей максимальной производительности Интел будет нельзя. АМД разовой выплатой будет не дороже Интел. Если вы живете на 5 тысяч рублей в месяц (бедный студент), для вас это может быть важно. В долгосрочной перспективе при больших планах на апгрейд, реконфигурацию и оптимизацию работы периферии путем установки новых PCIe контроллеров или нового оборудования на старые контроллеры, затраты на АМД будут скорее всего больше (у меня они были больше), чем на Интел, это будет связано с проблемами в работе стандартных контроллеров АМД, таких как USB и SATA.
Учитывая, что некоторые люди умудряются пользоваться такими процессорами, как Интел Атом и их производительность людей устраивает, то на применениях низкой производительности изделие АМД может быть использовано. Конкретно для процессора типа FX-4100 на имеющихся конструкциях охлаждения, чтобы вписаться в требования по шуму и энергопотреблению надо устанавливать реалистические (низкие) значения максимальных частот и максимального числа работающих ядер.
Главным негативным моментом, кроме работы самого процессора и чипсета, является работа софта, особенно фирмваре, который для АМД работает особенно скверно. Скверно работают драйвера ACHI/RAID, хуже чем для дисков времен XT, софт не может справиться с bad-секторами на диске, невозможно даже нормально перекопировать данные на новый диск. Проблемы с USB драйверами при переключении S-состояний.
Настройка P-состояний и S-состояний не работает из-за BIOS, переключение P-состояний софтом от Майкрософт на базе BIOS не дает при равном охлаждении задействвать буст на важных ядрах и p4-p5 состояния на неважных, укладываясь в тепловой режим. На самом деле когда говорят "нет настройки/переключения P/S-состояний", имеют в виду, что компьютер нельзя включить/выключить и перевести в/из сна, что совсем скверно, потому что до запуска приложений дело даже не доходит.
Одним фактором таких проблем является манера производителей процессора произвольно менять "битики" настройки и конфигурации в каждой новой модели процессора. Интерфейс конигурации процессора не продумывается с целью стабилизации, также как нет стабильного аппаратного интерфейса сокета, в результате получается процессор, на котором кроме бесполезного "hello world" ничего запустить реально нельзя.
Другим фактором является "фирмваре". Что такое фирмваре, кто, как и зачем его делает мы уже много раз рассматривали. Чтобы реализовать технологию "фирмваре" надо завести питомник по производству "нано-программистов", которые порождаясь будут отрабатывать свою зарплату внося беспрерывные модернизации. В результате удобная некогда система превращается в тихий кошмар - беспрерывные улучшения (назойливые как коммивояжер), весело подмигивающие виджеты (на деле, я уверяю, что мы уже все продали в прошлый раз за старые консервные банки, взять у нас уже больше нечего).
Третьим фактором является полицейско/рабовладельческий подход к взаимоотношениям, имеющий в мире большую популярность, когда пользователя никто и ни о чем не спрашивает, нагло навязывая ему те или иные вещи. Отличие этого подхода от самой злостной пропаганды в самых тоталитарных из тоталитарных государств только в том, что нам при этом всем надо славить свою свободу и быть уверенным, что это все сделано не конкретными злодеями, а исключительно демократично - голосованиями, самоуправлением и т.п., типа материализовалась единая и неделимая воля народа. Реализация "новых технологий" мной уже давно воспринимается практически как неумолимое нашествие злобной, вполне одушевленной человеконенавистнической силы, попирающей все на своем пути.
Результаты такого подхода на лицо. Например, ASROCK. У меня последнее время больше всего было их плат:
2009 год, AM3 - переключатель для отключения USB при выключении питания, 8х8 PCIe механический переключатель, все параметры процессора настраиваются, все S-состояния.
2011 год, AM3+ - переключателя для отключения USB нет, 8х8 PCIe механический переключатель нет, параметры процессора не настраиваются, только основные S-состояния.
2012 год, FM2 - S-состояний нет.
Процессор AM3 разблокировался, но в разгоне работал неуверенно.
Процессор AM3+ уже не разблокировался, но работал годами в разгоне очень стабильно.
Процессор FM2 мне вообще не удалось заставить работать хоть сколько нибудь продолжительное время.
Мне, положим, не нужен 8х8 PCIe механический переключатель, но такими усилиями к 2014 году ASROCK таки выпустит плату, на которой нано-процессора не будет совсем, потому что он все равно не работает.
Продолжение следует...
Обсуждение этой заметки в форуме.
Создано: 29.11.13
Последний раз отредактировано: 29.11.13
реклама
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Сейчас обсуждают