"На волне производительности": впечатления от участия в турнире Gigabyte

11 апреля 2010, воскресенье 04:17
slamms для раздела Лаборатория

Оглавление

Вступление

Компания "Gigabyte" - один из крупнейших производителей материнских плат. Широкий спектр задач, выполняемых современным пользователем, может нагрузить по полной даже самый мощный ПК. Но руководство компании отлично понимает нужды продвинутых юзеров, поэтому помимо широких возможностей разгона процессоров на материнских платах Gigabyte компания ведет тесное сотрудничество с самими пользователями, в том числе и с оверклокерами.

Ежемесячные тренинги, проводимые компанией Gigabyte для журналистов, дистрибьюторов продукции, форумчан русскоязычного сайта, позволяют донести все достоинства, получаемые от использования материнских плат "правильного производителя". А оверклокеров компания радует регулярными конкурсами: GOOC - ежегодный открытый международный чемпионат по оверклокингу; Первый Российский чемпионат по оверклокингу и твикингу - новый турнир, прошедший в Москве 12 декабря; а теперь ещё и "На волне производительности" - чемпионат по разгону на материнских платах Gigabyte на чипсете Intel P55, проходивший с 10 февраля по 10 марта на страницах форума gigabyte, а также на специально созданном сайте - http://p55oc.gigabyte.ru/

Участники боролись за денежный приз, а также возможность выступить на отборочном турнире GOOC Russia, который пройдет в апреле в Москве. Структура конкурса была построена таким образом, что победить в турнире можно было лишь при использовании экстремального охлаждения. Такой подход сразу позволяет отсеять определенный круг пользователей, которые не смогут составить достойной конкуренции участникам GOOC Russia.

Правила и структура конкурса.

Конкурс состоял из четырех этапов, на каждый из которых организаторы отвели по одной неделе. На первый взгляд, времени в одну неделю для выполнения поставленного задания больше, чем предостаточно. На деле же все выходило совсем не так, времени не хватало, чтобы выжать максимум из системы.

Этапы:

  • Super Pi1m
  • WinRar
  • разгон оперативной памяти (CPU-Z)
  • Intel Burn

За победу в каждом этапе победитель получал определенное количество баллов, причем количество получаемых баллов возрастало сообразно сложности задания. Так, например, за самое тяжелое задание - разгон оперативной памяти, организаторы присуждали победителю 40 баллов, а за самый простой и менее всего популярный - Intel Burn - всего 10 баллов.

Правила конкурса также были минимально простыми - использование только продуктов, которые можно купить в магазине (т.е. владельцам инженерных процессоров доступ был закрыт). В качестве подтверждения полученного результата от участников требовалось предоставить скриншот рабочего стола, на котором отображается выполненный тест, а также вкладки CPU-Z: процессор, оперативная память и материнская плата.

Этап 1: Super Pi1M

Super Pi1M – самый популярный процессорный бенчмарк. По популярности среди оверклокеров его можно сравнить с графическими тестовыми пакетами от FutureMark, а среди процессорных тестов – ему нет равных. Неудивительно, что оверклокерская философия проста: заветная мечта любого бенчера – установить мировой рекорд в Super Pi1M. А имена тех, кто уже отметился на вершине, навсегда станут легендами.

Тестовый стенд для 1 этапа:

  • материнская плата Gigabyte P55-UD6 (bios F7 vcore test);
  • процессор Intel Core i5 661 OEM 3,33 ГГц (133х25);
  • система охлаждения: Cooler Master Hyper TX3 (RR-910-HTX3-GP);
  • термоинтерфейс Arctic Silver Ceramique;
  • оперативная память Kingston HyperX 3x2 Гбайт DDR3 2000МГц CL8 (1,65 В, KHX2000C8D3T1K3/6GX);
  • видеокарта XFX GeForce GTX295;
  • жесткий диск Seagate 7200.12 500 Гбайт;
  • блок питания Corsair 1000 Вт.

Для удачного выступления в данном задании процессор, основанный на ядре Clarkdale, был лучшим решением. Выбор перед участниками стоял между двумя моделями Core i5: 670 и 661. Их главным отличием является множитель, который для i5 670 равняется 27, а для i5 661 – 26. Мне не удалось достать старший процессор, поэтому единственным вариантом стал Intel Core i5 661. С одним отключенным ядром, благодаря технологии TurboBoost, удается получить множитель 27.

Технические характеристики:

  • Архитектура — Nehalem
  • Ядро — Clarkdale
  • Техпроцесс — 45 нм
  • Число ядер — 2
  • Номинальная частота — 3330 МГц
  • Базовая частота (BCLK) — 133 МГц
  • Множитель — 25 (макс. 27 с 1 ядром)
  • Кеш L1 — 32 Кбайт
  • Кеш L2 — 256 Кбайт
  • Кеш L3 — 4 Мбайт
  • Уровень TDP — 95 Вт
  • Поддерживаемые технологии Intel — Intel Virtualization Technology, Hyper-Threading, EIST, Intel Execute Disable Bit, Intel HD Boost, Intel Turbo Boost.

Первым делом я решил понять принцип работы новой для меня системы, а также настроить Windows под Super Pi1M. В качестве операционной системы я использовал английскую версию Windows XP SP2 32 bit.

За отчетную точку я взял отметку по частоте в 4 ГГц и принялся за настройку Windows. Для получения максимального результата я использовал следующие твики:

  • отключение служб;
  • LSC;
  • вывод языковой панели на рабочий стол;
  • серебристая тема оформления Windows;
  • отключение неиспользуемых IDE каналов;
  • оконный твик;
  • драйвера на видеокарту и чипсет не устанавливались.

На результат большое воздействие, как выяснилось в процессе общения с платформой, оказывает частота шины QPI, которую мы задаем множителями из BIOS. В BIOS доступны значения от 12 до 48. Но на деле оказалось, что рабочими являются значения диапазона от 24 до 48, а 24 в BIOS – это 12 в действительности. Анализируя зарубежные результаты, я пришел к выводу, что именно множитель шины QPI является ограничителем для максимальных результатов.

На частоте 5 ГГц удалось получить результат 8,391 секунды. Но для сохранения высокого коэффициента производительности я использовал максимальный множитель QPI – 24. Коэффициент производительности считается по формуле: результат умножить на частоту в МГц. Как казалось на первый взгляд, я чувствовал себя готовым перейти к использованию жидкого азота. Значит, пришло время делать анти-колдбаг мод.

Именно с выходом процессоров Clarkdale пошла мода на различные модификации материнских плат для снятия coldbug и coldboot на процессорах Intel. Суть модификации, с которой поделился перед общественностью один из оверклокеров HiCookie, заключается в замыкании ног одного из резисторов околосокетного пространства. Для верности мне его выпаяли совсем и просто замкнули ноги.

Смысл в этой модификации по моему представлению следующий. Данный резистор относится к системе мониторинга температуры процессора. После наших манипуляций мы обманываем мониторинг, и система думает, что на самом деле процессору не так холодно, как в действительности.

Первый блин, естественно, оказался комом. На процессоре Intel Core i5 670, взятом на пару часов, на частоте 6 ГГц получилось ровно 7 секунд. Отдельно стоит отметить результат Andrey!, который предложил устроить соревнование SuperPi 6GHz clock challenge. На 6 ГГц он получил результат 6,969 c.

У меня дальше идти с 24 множителем QPI процессор не хотел никак. Выяснилось, что у процессора coldboot при минус 120 градусах по Цельсию, а Coldbug - минус 140. Стало понятно, что следует подбирать оптимальный множитель QPI, а также попробовать подать на процессор выше 1,9 в, которые являются максимальным значением в BIOS.

В этот день на hwbot.org появился результат одного норвежского оверклокера, на вкладке Mainboard CPU-Z в графе версии BIOS значилось название – F7 vcore test, напряжение на процессоре было выше 2 В. Я написал HiCookie и попросил прислать мне такой же BIOS. Успешно прошившись, я увидел на экране версию F6, а сами настройки позволяли даже менять частоту Uncore. Но F6 и, правда, оказался F6, хотя HiCookie долго не мог мне поверить, что он мне прислал не ту версию. Но через пару часов я получил нужный BIOS и собрал в час ночи систему заново.

В этот раз результаты получились намного лучше. На процессоре Intel Core i5 661 coldbug отсутствовал, но coldboot остался прежним -120 градусов по Цельсию. На частоте 6357 МГц получился результат 6,625 секунды, на момент подачи он являлся лучшим в России. Но всегда хочется выжать максимум, поэтому я на свой страх и риск поставил напряжение 2,15 В, что оказалось ошибкой. Процессор больше не включился, хотя внешних признаков смерти на нем не было.

Максимальная валидация CPU-Z, полученная на данном процессоре – 6527 МГц. Главной отличительной чертой разгона Clarkdale на материнских платах Gigabyte является подбор оптимального значения множителя шины QPI. Для Super Pi 1M лучшим оказался множитель – 20, для CPU-Z - 18. Когда я пробовал другие множители, то увидеть результат выше 6200 МГц было большой удачей.

Итоговые результаты первого этапа:

  • 6,625 – 20 баллов, slamms
  • 6,703 – 10 баллов, VinniBago
  • 6,831 – 5 баллов, S_A_V

Этап 2: WinRar

Вторым заданием конкурса организаторы решили поставить встроенный тест архивирования в WinRar. Победа в данном задании определялась по наилучшему результату средней скорости архивации данных. WinRar поддерживает многопоточность, так что даже, если бы Intel Core i5 661 и был жив, то серьезной конкуренции он не смог бы составить. Лучшим вариантом здесь был бы процессор Intel Core i7 870. Но возможности достать такой процессор не было. Поэтому я использовал Intel Core i7 860.

Технические характеристики:

  • Архитектура — Nehalem
  • Ядро — Lynnfield
  • Техпроцесс — 45 нм
  • Число ядер — 4
  • Номинальная частота — 2800 МГц
  • Базовая частота (BCLK) — 133 МГц
  • Множитель — 21 (макс. 26 с 1 ядром)
  • Кеш L1 — 32 кб
  • Кеш L2 — 256 кб
  • Кеш L3 — 8 Мб
  • Уровень TDP — 95 Вт
  • Поддерживаемые технологии Intel — Intel Virtualization Technology, Hyper-Threading, EIST, Intel Execute Disable Bit, Intel HD Boost, Intel Turbo Boost.

Для получения максимального результата нужно разгонять по максимуму, как процессор, так и оперативную память. Естественно, сначала нужно было понять, какая производительность нормальная. Можно ли что-то потвикать и поднастроить?

С версией Windows экспериментировать я не стал и решился остаться на Windows XP SP2 32bit после проверки Vista. Результаты в Windows Vista имели большую погрешность, а мне нужна стабильная повторяемость. На 4 ГГц мой первый запуск WinRar показал результат – 4500 кб/с, а должно было быть больше 6000 кб/с. Дело было в отключенной службе Plug and Play, которая в Super Pi1M позволяет отыграть 0,16 с. Но для WinRar она оказалось вредной, и после её включения удалось получить результат 6047 кб/с.

Если в Super Pi 1M мастер-класс на 6 ГГц продемонстрировал – Andrey!, то своим результатом в WinRar решил похвалиться не менее известный оверклокер – oDDiTy. Поиграв с таймингами и опустив предельно низко задержки памяти, ему удалось получить результат – 6149 на частоте 3800 МГц.

Вдоволь поиграв с системой на воздухе, я, наконец, решил узнать, что смогу получить на жидком азоте. Первоначально я определился с делителем памяти, выбрав 2:10, так как на 2:12 частота памяти получалась слишком высокой, а на 2:8 – результаты были очень слабыми. Потратив примерно три часа, удалось получить результат – 7203 кб/с. Честно говоря, я был недоволен полученным результатом, так как рассчитывал, что процессор сможет проходить данный тест на частотах выше 5 ГГц. Но 4926 Мгц оказались для него пределом в этом тесте.

Оптимальная температура для процессора – 70-75 градусов по Цельсию, а Coldbug был на -95градусах. Видимо, температуры ниже минус 75 градусов не мог переносить уже контроллер памяти. Также выявилась интересная особенность поведения материнских плат Gigabyte со сделанным анти-колдбаг модом при работе с процессорами Lynfield. После зависания система отказывалась стартовать при любой температуре, а помогало только полное отключение питания. Такой же трюк с успехом срабатывал и при температурах выше -100 градусов, правда, система практически сразу висла при попытке запуска Windows. Точно такая же ситуация была и с материнской платой DeDaL – Gigabyte P55A-UD6.

Но результат меня не устраивал, и поэтому на следующий день я собрал стенд заново. Только теперь я решил попробовать использовать более низкий множитель процессора, чтобы повыше поднять шину. Следовательно, частота памяти тоже увеличится. В этот раз при использовании множителя 20 удалось получить результат 7540 кб/с. Частота процессора составила 4820 МГц, а память работала на частотах 2400 Мгц с таймингами CL7 7-7-21 1T.

Такая частота памяти при CL7 меня очень впечатлила, правда, переход с CL8 на CL7 мне добавил всего 19 кб/с к результату. А вот энтузиазма к следующему этапу – разгон оперативной памяти – такой результат добавил предостаточно.

Итоговые результаты второго этапа:

  • 7700 – 30 баллов, DeDaL
  • 7540 – 20 баллов, slamms
  • 6831 – 10 баллов, S_A_V

Этап 3: Разгон ОЗУ

До конкурса Gigabyte специально разгоном оперативной памяти я никогда не занимался, да и, пожалуй, даже не думал, что когда-нибудь этим займусь. Но приоритеты поменялись, да и Elpida MGH-E была в распоряжении. Почему бы и нет?

Для разгона оперативной памяти достаточно знать несколько вещей:

  • для получения максимального результата лучше использовать одну планку, т.е. одноканальный режим работы памяти;
  • процессор необходимо охлаждать жидким азотом, так как в нем находится контроллер памяти, от удачности которого во многом также зависит итоговый результат;
  • планку памяти тоже нужно охлаждать жидким азотом, так как от понижения температуры на большинстве модулей наблюдается масштабирование;
  • нужно подобрать оптимальные задержки, как основных таймингов, так и всех субтаймингов.

Такой медный набор производства DeDaL&SiD я использовал для третьего этапа: стакан для жидкого азота, медная планка из набора охлаждения для памяти, а также стакан на видеокарту. Стакан на видеокарту использовался для охлаждения памяти. Медная плоская пластина в горизонтальном положении аккуратно укладывается на планку памяти, а сверху ставится стакан для видеокарты, в который и наливается жидкий азот.

Практически с первого раза удаётся получить результат в 2700 МГц с таймингами CL9 9-9-27, но улучшить или хотя бы повторить больше не удалось. Результат был получен при напряжении на памяти 1,76 В, а температура планки была примерно 0 градусов Цельсия, температура процессора -50 градусов. С другими таймингами и настройками результата выше 2650 Мгц я не видел. В чем причина такого поведения памяти для меня так и осталось загадкой.

Нужно было срочно искать замену, и я решил купить 2 гигабайтную планку 1333 МГц Crucial на микросхемах Micron D9KPT. Такой выбор был сделан из-за недавно полученного результата DeDaL в 3 ГГц на памяти с такими же микросхемами, но, правда, с 1 Гбайт-ом памяти. Но желаемым сочетанием объема и микросхем пришлось пренебречь из-за его отсутствия.

За три часа до окончания задания, сидя на заднем сиденье машины в обнимку с 25 литровым дьюаром жидкого азота, отлично понимаешь, что шансы на получение хорошего результата с каждой минутой становятся все меньше. На победу рассчитывать мне не приходилось, так как DeDaL сказал мне по телефону, что ему удалось уйти за 3050 Мгц. Также я знал результат S_A_V, который выложил его на форум за день до окончания – 2807 МГц. По итоговым баллам после двух этапов стало понятно, что для того, чтобы составить конкуренцию на 4 этапе, мне нужно второе место. Тогда у нас с DeDaL будет по 70 баллов, и победителя определит Intel Burn.

За полтора часа до окончания этапа удаётся получить результат 2815 МГц с таймингами CL11 12-11-31 2T при напряжении 2,1 В. Цифры выше 2800 Мгц удалось увидеть за несколько часов всего пару раз. Думаю, что результат в 2815 МГц был получен благодаря оптимальной температуре. Планка памяти после температур -90 градусов вела себя нестабильно, и система висла в момент приветствия Windows. Как позже рассказал DeDaL, у него были такие же проблемы, которые решились переходом с XP на Windows 7.

Лучший результат был получен при температуре -105 градусов Цельсия. Windows грузил при температуре на памяти меньше -90, а затем замораживал до -105. Процессор в этот момент работал на температурах ниже -80 градусов. Очень хотелось подать побольше напряжения на память, но выше 2,14 В система зависала с Post-code D5. Работоспособность система обретала только после обнуления CMOS. Выставлять все настройки приходилось заново, поскольку материнская плата отказывалась загружать профиль с настройками, при которых был получен лучший результат.

Итоговые результаты третьего этапа:

  • 3064 – 40 баллов, DeDaL
  • 2815 – 30 баллов, slamms
  • 2807 – 20 баллов, S_A_V

Этап 4: Intel Burn

Intel Burn – это тест на стабильность системы. По сути, это тот же Linpack, но в графической оболочке. Intel Burn практически полный аналог LinX, но для меня загадкой так и осталось, почему разработчиком программы было выбрано название, в котором фигурирует Intel. Ведь одного запуска программы достаточно понять, что Intel нисколько не причастна к разработке данного бенчмарка. Я думаю, вряд ли бы они стали размещать в интерфейсе программы кнопку Donate.

Тем не менее, мечты многих борцов за стабильность скоро станут реальностью. Результаты стабильности системы под Linpack-ом, охлаждаемой жидким азотом, хотели увидеть многие пользователи Конференции. Чуть забегу вперед и скажу, что если на воздухе стабильность системы от валидации CPU-Z отличается в среднем на 300 МГц, то с жидким азотом – разрыв достигает целых 600 Мгц.

Первой проблемой с Intel Burn стало то, что он отказывался запускаться на Windows XP. Я подумал, что отключил слишком много служб, и решил залить девственный образ XP. Но в полноценной сборке Windows, в которой были включены все службы, Intel Burn опять-таки не запустился. Ситуация с Windows Vista повторилась один в один, как и с XP. Остался один единственный вариант – это Windows 7, в которой с запуском теста проблем не возникало.

Разбираться с тестом долго я не стал и практически сразу поставил на процессор стакан. Как позже выяснилось, это было сделано зря. После первых проб максимальным результатом стало 105,49 с на частоте всего 4200 Мгц. Такой низкой частоты я не ожидал увидеть, ведь на 4 Ггц он работал на воздухе и проходил данный тест.

Естественно, меня такое положение дел не устраивало, и я решил заменить процессор. Опять же Intel Core i7 860, но более поздней недели выпуска. Оставалось рассчитывать только лишь на удачу, и она, как ни странно, была на моей стороне. Новый процессор смог пройти Intel Burn на частоте 4510 МГц, а результат получился 98,83 с.

За пять часов до окончания конкурса я считал, что сделал все возможное, но последний день несколько перевернул мое мнение. В последний день мы (я, DeDaL и Smoke) собрались побенчить, но так и не смогли получить интересных результатов. И в восемь вечера DeDaL пытается улучшить свой домашний результат в 105,58 с, полученный дома. Такой низкий результат объясняется отсутствием термопары, а без четкого контроля температуры получить высокий результат достаточно сложно.

Максимальной частотой, на которой проходит Intel Burn, оказался рубеж в 4510 МГц. Но получаемые результаты сильно разнились, на одинаковых частотах можно было получить разницу в 12 с. Проверил весь реестр, отключил LSC, поставил файл подкачки по выбору системы – ничего не помогало. Оставался только один вариант – сам процессор. Ведь не может же он работать по-разному при выполнении одинаковых задач. В голову приходит одна единственная мысль, что проблема в виртуальных ядрах, которые нестабильны на данной частоте.

Запуск теста с 4 потоками расставил все по своим местам. Результат 98,37 с, и DeDaL, не верящий мне, что мой результат хуже. Пока размораживаем стенд, мы решаем проверить нашу идею на меньших частотах. Оказывается, что ситуация идентичная, и виноват софт, который не умеет работать с восемью потоками. На мой взгляд, организаторы выбрали не самый лучший тест для конкурса, но пусть это останется на их совести.

Итоговые результаты четвертого этапа:

  • 98,37 – 10 баллов, DeDaL
  • 98,82 – 5 баллов, slamms

Заключение

Итоговое расположение мест:

1 место – 80 баллов DeDaL

2 место – 75 баллов slamms

3 место – 35 баллов S_A_V

Хочу поблагодарить компанию Gigabyte за столь интересное соревнование. Надеюсь, что организаторы учтут недочеты, и грядущий 2 мая GOOC Russia 2010 пройдет на ещё более высоком уровне. Отдельно стоить отметить участников конкурса, не вошедших в число победителей: VinniBago, Andrey!, NeoForce.