Продолжение. Начало - здесь.
С наступлением летом в Москве изнуряющего зноя мы, было, решили уехать из родной коптильни и отдаться простым радостям жизни рядового оверклокера - прохладному пиву, ароматным шашлыкам и освежающим озерам нашей огромной и где-то (судя по рассказам) бездымной страны.
Но, после прочтения откровенно воодушевляющих отзывов на первую часть цикла статей, стало ясно, что не стоит торопиться с отъездом, а следует протестировать с разгоном еще несколько интересных десктопных платформ, оставив серверные на осень. Да-да, сегодня вас ждут новейшие шестиядерники от AMD и Intel, проверка работы технологии HT и сравнение результатов с предыдущим четырехядерным фаворитом. Также по просьбам читателей был изменен список тестовых приложений. Но сначала о разгоне.
Вы скажете: только откровенным маньякам может прийти в голову заниматься разгоном в таких условиях, да еще и вне прохладных серверных. «Хм-м, - подумали мы, - а ведь эти условия как нельзя лучше подходят для тестов железа, которое должно работать днем и ночью, и отказ которого в 40-градусную жару воспринимается владельцами как локальный Армагеддон и грозит серьезными моральными и финансовыми затратами».
Действительно, люди, которые покупают (или собирают) рабочие станции, хотят быть уверенными в том, что они будут работать именно тогда, когда от них ожидают наискорейшего результата. Как назло, такое время может выпасть и на период климатических недоразумений, опутавших горячим смогом большую часть Центральной России. Безусловно, есть несколько проверенных временем решений – кондиционер, прохладная и уютная спальня админа серверная, водяное охлаждение и прочие дорогие и не всегда доступные вещи. Но большинство людей не озаботились этим до прихода лета, а решать проблему сейчас уже поздновато.
Поэтому в данном тестировании принимают участие только те процессоры, которые в предварительном забеге на частоте 4 ГГц смогли выдержать сутки мучений LinX x64 (графической оболочкой к известному Linpack) при использовании воздушного охлаждения. Температура окружающей среды составляла в среднем 30 градусов. Отличные условия: ведь если эти процессоры смогли вытерпеть такие муки в разгоне, то без проблем выдержат и работу на стандартных частотах при меньшей забортной температуре.
После проведения предварительного тестирования внезапно оказалось, что все процессоры, которые мы выбрали для тестов, вполне способны существовать и даже работать при таких условиях. Потому с гордостью представляем вам две новые платформы, не засветившиеся в предыдущей части цикла статей, и одного «ветерана», послужившего представителем всех старых платформ, «мальчиком для битья», эталоном и ориентиром.
Итак, сегодня в тестовой список для поиска оптимальной платформы рабочей станции для экономного профессионала попали новейшие шестиядерные настольные процессоры – AMD Phenom II X6 1090T Black Edition (Thuban, AM3) и Intel Core i7 980X (Gulftown, LGA1366). Между ними есть много общего – шесть ядер, схожие штатные частоты, принадлежность к последнему поколению, а также технологии повышения частоты отдельных ядер – Turbo Core у AMD и Intel Turbo Boost (мы не рассматриваем их в рамках данного тестирования, поэтому они были выключены).
Различий тоже много: в первую очередь заставляют обратить внимание размер L3 кэша, который составляет 6 и 12 Мбайт соответственно у детищ AMD и Intel, и наличие у 980X технологии Hyper-Threading, в которую автор данной статьи абсолютно не верил до получения результатов тестирования. Хотя, наверное, правильней было бы сказать не так: все-таки самым сильно бросающимся в глаза отличием является ценовое – разница составляет 31490 рублей или иначе - Intel в четыре раза дороже, чем AMD (9900 против 41390 рублей) по ценам известного московского магазина.
За эталон были взяты показатели лидера прошлого тестирования, Intel Core i7 920 (Bloomfield), стоимость которого в том же магазине составляла 8780 рублей - всего на 1120 рублей дешевле, чем флагман от AMD. Интересно будет посмотреть, способен ли наш ветеран постоять за себя, ведь мы дали ему возможность воспользоваться технологией HT.
Как уже было сказано, список тестовых приложений был сильно изменен по просьбам наших дорогих читателей. Он стал немного меньше за счет исключения некоторых избыточных приложений по кодированию аудио в Linux, но гораздо острее по конкуренции в среде Windows... Впрочем, судите сами. Итак, в список вошли:
Перед тем, как перейти к подробному описанию тестовых стендов, позволю себе рассказать о новом появившемся тесте. Так же, как и программисты в *nix системах де-факто пользуются gcc для компиляции своих проектов, их собратья из цеха Windows чаще всего прибегают к родной в этой среде Microsoft Visual Studio 2010. В качестве тестового проекта для компиляции был взят свободно распространяемый 3D движок Ogre 3D. Замерялось время компиляции с нуля его основной части OgreMain. Вдобавок претерпел изменения и наиболее интересный тест – 3D рендеринг в 3DS Max – по многочисленным просьбам был использован плагин для рендеринга vRay.
Как и в первой части цикла статей, были использованы не самые топовые компоненты, чтобы поддержать имидж рабочих станций для профессионалов с ограниченным бюджетом.
Чтобы исключить все влияющие на производительность факторы, кроме процессоров, мы использовали абсолютно одинаковые компоненты для всех платформ, включая оперативную память, видеокарту и дисковую подсистему (состоящую, впрочем, лишь из одного диска). Две платформы Intel использовали одинаковые материнские платы.
Действительно, как вы видите ниже, сравнение было честным.
Теперь пришло время конкурентов, с одним из которых вы отчасти уже знакомы.
И новичок – та же платформа Intel LGA1366, но с процессором Gulftown:
Остальные компоненты, остававшиеся постоянными у всех наших испытуемых:
Хотя прекрасно известно, что профессионалы редко занимаются оверклокингом своих рабочих машин, мы относим себя к людям иного сорта и не можем не посвятить разгону часть статьи. Людям сомневающимся может быть интересно услышать, что все три системы успешно прошли жесткий тест в сутки Linpack перед тестированием. И это все несмотря на изнуряющую жару за окном и в лаборатории.
При тестировании в ОС Linux были интересны лишь лучшие из лучших, поэтому в разгоне было исследовано поведение только быстрейших процессоров – 1090T и 980X, причем последний не имел права воспользоваться технологией Hyper-Threading. Таким образом, сравнение производилось мегагерц-в-мегагерц и ядро-в-ядро.
В среде Windows же, наоборот, были проведены все испытания, чтобы посмотреть, каких максимальных результатов, в том числе и с использованием HT, можно достичь на всех процессорах. Полагаю, именно эти результаты будут наиболее интересны всем далеким от научной деятельности и разработки под Linux.
Ниже вы можете увидеть снимки главного окна программы CPU-Z для всех режимов работы тестовых платформ.
AMD Phenom II X6 1090T Black Edition:Начнем разбор полетов. Забегая вперед, отмечу, что на радость фанатам обоих лагерей на этот раз все получилось гораздо кровавей интересней, чем в прошлой части цикла статей. Соответственно, ожидайте больше аналитики и интересных выводов.
В отличие от предыдущей части данного цикла статей, в этом разделе мы рассмотрим лишь 7-zip, поскольку его производительность отлично соотносится с остальными архиваторами. Вначале дадим нашим камням попробовать на вкус его Windows версию.
Как видно из первых же графиков, в грамотно распараллеленных приложениях увеличение количества ядер с четырех до шести (и, вероятно, также и объема кэша) весьма благотворно отразилось на состоянии дел в лагере АМД. Шестиядерный 1090T щелкает MIPSы как орешки и даже позволяет себе обойти 920 с включенным HT на штатных частотах. Впрочем, даже такой успех все-таки теряется на фоне безоговорочной победы его шестиядерного конкурента из лагеря «синих».
Заметим далее, что разгон и постановка всех платформ в одинаковые условия по частоте показывает, что HT, в которую я абсолютно не верил до начала тестов – это технология, позволяющая совершенно бесплатно получить (в правильно заточенных приложениях) очень большой прирост. И да, особенно ясно это видно, когда из шестиядерника детище «голубого» гиганта превращается в двенадцатиядерник. Не самое удобное зрелище для любителей мониторить загруженность системы в штатном диспетчере задач. Дополнительные, пусть и виртуальные, шесть ядер дают фантастический бесплатный прирост в более чем 10000 MIPS.
Для нашего эталона из предыдущей части HT тоже приносит свои дивиденды – немногим более 7000 MIPS. Соперник из стана зеленых не может похвастаться наличием такой технологии, что, впрочем, не мешает ему в битве гигагерц-в-гигагерц показывать производительность поразительно близкую к 920 с HT и даже к 980X без HT. Разница составляет от двух до трех тысяч MIPS. Заметно, но не критично. Намного очевиднее отрыв Intel Core i7 980X от остальных, составляющий более 10000 MIPS от ближайшего преследователя – себя же самого.
Продолжим, и, как и в прошлый раз, сравним производительность Windows и Linux версий этого замечательного архиватора.
Несмотря на то, что мы использовали немного более свежую версию 7-zip в ОС Linux, результаты не выглядят особо впечатляюще, даже в разгоне. Разница между двумя ОС составляет 2-3 тысячи MIPS в лучшем случае, явно не в пользу Linux версии. Расстановка сил не изменилась, что было вполне ожидаемо.
Как вы, вероятно, помните из первой части, в этом полезном для оценки серверной производительности тесте свою единственную чистую и безоговорочную победу одержал процессор от AMD.
Буду краток – на равных частотах флагман AMD снова опережает лидера Intel и на этот раз уже более чем на 20%.
Может быть синему «камню» помогла бы поддержка HT…
Но нет – при работе со штатными частотами работающий на большей частоте и на 12 потоков 980X немного, но проигрывает своему зеленому конкуренту. Снова чистое ура в адрес AMD! Конечно, это гипербола, в такую жару кричать совсем не хотелось. Хотелось просто лечь и заснуть. Лучше навсегда )
Начнем наши свежие, хорошо приближенные к реальности тесты. Посмотрим, как покажут себя сегодняшние герои при выполнении самого нудного для всех программистов задания – компиляции. Лично у меня уже вошло в привычку: нажал «Build» – пойди, попей чаю. Тем же, кто не хочет каждый раз проделывать такой ритуал, стоит самое пристальное внимание обратить на впервые проводимый тест компиляции главной части 3D движка Ogre3D в Microsoft Visual Studio 2010.
Что же, прекрасно, как и ожидалось, 1090T обходит i7 920, причем даже на одинаковых частотах, однако возможность использования HT процессорами Intel сводит на нет все усилия зеленого лагеря. Безоговорочная победа и время, затрачиваемое на компиляцию, почти в два раза меньше у процессора Intel Core i7 980X с включенным HT, чем у 1090T. В крупных проектах ждать восемь часов или четыре часа… Я выберу чай и прогулку в парке процессор Intel и фантастическую производительность.
Что могу сказать – чуда не произошло, gcc распараллеливается гораздо хуже и позволяет скостить всего от трех до двух секунд. Снова 1090T обходит 920, но в битве мегагерц-в-мегагерц преимущество опять на стороне Intel Core i7 980X.
В результате ленибесполезности мы убрали тесты кодировщиков в среде Linux. Так что приступим сразу к единственному тесту, кодировке в ОС Windows альбома Guns'n'Roses (это, безусловно, очень важно!) из FLAC в MP3. Хотя мне, право, сложно придумать, кому может понадобиться это кощунство.
dbPoweramp меня разочаровал. Программа, как оказалось, не умеет пользоваться более, чем четырьмя потоками, поэтому как на использование HT, так и на переход от четырех к шести ядрам ей наплевать. В любом случае, пару секунд вы сможете выиграть, используя 920 в разгоне.
Приступим к моему любимому тесту. Быстрый, оптимизированный, все и сразу ставит на свои места.
Как прекрасно видно, снова балом правят процессоры Intel. Если использовать поддержку HT, то оба «камня» вырываются вперед. Примечательно, что почти как в случае с Visual Studio 2010 и в штатном, и в разогнанном режимах 1090T работает почти в два раза медленней, чем 980X с включенным HT. Любо-дорого смотреть на работу хорошо оптимизированных программ.
Мы снова взяли для тестов показательные научные программы GROMACS и GАUSSIАN.
Мда… Оказывается, даже такая замечательная программа, как GROMACS, которой пользуются наши кранчеры, не умеет использовать больше, чем шесть потоков. Точнее, использует их, но совершенно неэффективно. В остальном результаты похожи на все остальные – шестиядерник от AMD без проблем расправляется с своим четырехядерным конкурентом от Intel, но также легко и уступает в борьбе с быстрейшим в этой части тестирования процессором от Intel. Разгон не только не меняет, но даже усугубляет ситуацию – топовые шестиядерники от извечных конкурентов разделяет очень большая по меркам GROMACS цифра в почти четыре Гфлопс.
Гауссиан - отличный показатель неоптимизированности под платформу AMD. При выполнении одинакового комплекта задач 1090T подчистую «сливает» двум другим нашим конкурсантам. В свою очередь, при включении HT Гауссиан продолжает использовать 8 или 12 потоков, соответственно, что, впрочем, не приводит к желаемому повышению производительности. Все-таки, виртуальность технологии HT дает о себе знать.
Последним на сегодня тестом будет знаменитый пакет от Discreet Autodesk. Обращаю внимание почтенной публики, что по многочисленным просьбам мы стали использовать пакет vRay во время нашего тестирования. Уверен, профессионалам будет интересен этот раздел. Выбираете платформу для «рендер фармы» – загляните ниже.
Да! Да! Да! Напоследок мы получаем отличные и очень показательные результаты. Видно, что vRay с удовольствием откликается как на повышение частоты, так и на увеличение числа ядер. В штатном режиме шестиядерник от АМД безо всяких проблем разделывается со своим четырехядерным конкурентом из лагеря «синих», даже если тот использует HT. Что там говорить – даже при работе в одинаковом разгоне мы видим преимущество 1090T над 920, до тех пор, впрочем, пока тот не призывает на помощь гиперсилу Hyper-Threading.
Ожидаемо, что наилучший результат в этом отлично распараллеливаемом рендере показал 980X, использующий свой козырь – HT. Разница при использовании и отключении данной технологии составила около 23%, что неплохо, в особенности учитывая её бесплатность.
В сегодняшней части нашего цикла статей мы учли все пожелания читателей и получили интересные результаты. Ниже представлены графики, наглядно показывающие расстановку сил в сегодняшнем тестировании.
С первым графиком все должно быть ясно: в каждом тесте рейтинг лидера принимался за 1, а остальные процессоры получали меньше одного. После этого результаты тестов суммировались и высчитывался рейтинг, который мы поделили на цену в рублях на сайте price.ru по состоянию на 05.09.10. Этой методикой мы будем продолжать пользоваться в данном цикле статей.
Второй график получился несколько сложнее, но он визуально дает нам такие же результаты, что и первый. Очевидно, что чем правее и ниже будет находиться точка, выражающая соотношение цена/производительность каждого процессора, тем настойчивей стоит задуматься о его покупке.
Увеличение числа ядер с четырех до шести приносит ощутимый прирост производительности, в среднем такой же, как и прирост в частоте от разгона. В большинстве тестов владелец шестиядерника от AMD, 1090T Black Edition, заплатив 9900 рублей, не прибегая к разгону, легко обойдет по производительности своей рабочей станции любителя примерно схожих по цене четырехядерников от Intel.
Что касается новейшего экстремального короля – Intel Core i7 980X, то при его цене в четыре раза выше, чем у двух других участников нашего тестирования, производительность, увы, вырастает не столь значительно. Разница в работе, как при штатных частотах, так и в разгоне, а также при использовании технологии Hyper-Threading никогда не достигла двух раз в лучших случаях и составляла лишь несколько десятков процентов в худших. Замечу, что результаты сильно менялись в зависимости от возможностей программы использовать все 12 потоков. Поэтому перед тем, как включать «волшебную» технологию, сначала проверьте, может быть, ваша программа вообще однопоточная? К сожалению, такое тоже часто встречается, даже сейчас.
На вопрос, что лучше взять, чтобы построить высокопроизводительную рабочую станцию для профессионала при минимальных расходах, теперь я могу смело ответить – наиболее оптимальным выбором при работе на штатных частотах будет 1090T, в разгоне – Intel Core i7 920 или аналогичная по стоимости более новая четырехядерная модель от Intel.
Призом за наиболее эффективное выбрасывание денег награждается процессор Intel Core i7 980X. При такой стоимости он должен был обеспечить минимум трехкратный прирост производительности над коллегами. Так что, безусловно, самым осторожным решением будет подождать, когда рак на горе свистнет, когда Intel выпустит доступный шестиядерный процессор со схожей частотой, но без разблокированного множителя. Но готовы ли мы ждать, вот в чем вопрос?
В следующей части цикла статей мы рассмотрим новейшие серверные платформы и углубимся в измерение производительности на платформе ОС Linux. Также вас ждет несколько сюрпризов и в части Windows. Оставайтесь на связи!
Выражаем благодарность: