Выбираем платформу для серьезной работы (часть I)

29 июня 2010, вторник 14:39
Iliapan для раздела Лаборатория

Оглавление

«Терпение – высшая добродетель»
Иоанн Златоуст

Вступление

С недавних пор в жизни простого человека появились доступные компьютеры, оснащенные современными четырехъядерными процессорами и быстрыми жесткими дисками... Меньше времени стало уходить на ожидание, больше на работу. Практически канули в прошлое те системные блоки, на которых приходилось ждать длительной загрузки очередной игрушки, распаковки архива или обработки фотографий. Однако в домашнем сегменте чаще всего не процессоры оказываются слабым звеном системы. Вспомните, как долго в последний раз вы ждали, когда девочка на кассе банка нажмет заветную any key?

Другое дело – профессионалы: режиссеры видеомонтажа, звукорежиссеры, фотографы, 3D моделеры и прочие интересные личности... С приходом в их индустрию формата FullHD и стереоизображения они тоже стали задумываться над тем, не выкинуть ли их старую рабочую лошадку в окно, когда время обработки видео файла доходит до суток. И это не говоря уж о том, что сцена с какой-то несчастной сотней миллионов вершин и сотней источников света обрабатывается так долго, что к концу подходит уже недельный запас пельменей ;). Отмечу, конечно, что мы не говорим здесь о тех людях, у которых есть доступ к render farms (высокопроизводительные многопроцессорные системы и графические станции), ведь им, в общем-то, все равно, час или полтора обрабатывается кадр из их нового блокбастера.

К счастью, с выходом новых платформ от AMD и Intel, у профессионалов появилась возможность за вполне реальные деньги получить производительность, позволяющую им не сходить с ума при каждом нажатии кнопки «Render». Для того, чтобы помочь им в голосовании своим заработанным потом и кровью рублем, нами была произведена обширная работа по выявлению лидера по чистой производительности и по соотношению производительность/цена как среди домашних, так и среди серверных платформ. И, как оказалось впоследствии, полученные результаты неплохо коррелируют с результатами моего коллеги Phoenix_, проводящего игровые тесты.

Итак, господа оверы, пристегните ремни и приготовьтесь – мы приступаем к серьезной работе.

Участники и методика тестирования

В первой части нашего тестирования принимали участие четырехъядерные настольные процессоры Intel и AMD, принадлежащие к самым производительным из доступных на рынке архитектурам, но при этом вполне доступные к покупке обычному пользователю: AMD Phenom II X4 940BE (Deneb, $125), Intel Core i7 920 (Bloomfield, $280) и Intel Core i5 750 (Lynnfield, $200). Цены указаны для сравнения и были взяты из прайс-листа крупного американского интернет-магазина.

Представленные выше процессоры были выбраны нами неспроста. Именно они в большинстве случаев используются оверклокерской братией для разгона, а также становятся основой высокопроизводительных игровых и рабочих станций. В этой статье нашей целью станет сравнение их производительности в штатном и разогнанном режимах для выявления наиболее оптимальной в плане производительность/цена платформы для построения рабочей станции. Поэтому список приложений будет достаточно специфичен, но при этом и очень обширен, как вы увидите, многие из этих приложений никогда не использовались в нашей тестовой лаборатории. Тем интересней будет посмотреть, как проявляют себя тестируемые платформы не в игровых или синтетических, а во «взрослых» приложениях, реально используемых профессионалами индустрии в повседневной жизни.

Для начала нашей целью было выбрать операционные системы для тестов. Первой без колебаний была выбрана наиболее знакомая и родная автору ОС Linux, как наиболее подходящая для платформы рабочей станции и сервера, а для простоты использования и приближения стенда к реальной жизни был взят популярный в России, да и во всем мире, дистрибутив Ubuntu 9.04 (Jaunty Jackalope). Самая последняя версия Ubuntu страдает разного рода «неприятностями», поэтому от нее решено было отказаться.

Для начала в список тестовых приложений для этой ОС попали как программы для конвертирования аудио: LAME MP3, OGG, FLAC, Monkey Audio, WAVPack, так и программа для оценки производительности процессора в серверной работе: OpenSSL RSA performance. Отметим, что в реальной жизни сервера он тратит больше всего времени на обращение к файловой системе, вследствие этого мы не будем приводить здесь тесты PHP/MYSQL.

Но, конечно же, основой нашей коллекции тестовых приложений стали лучшие программы для профессионалов: такие приложения для 3D моделирования и рендеринга, как Maya 2008, Blender Render и Raytracing Render benchmark, а также впервые в истории наших тестов ведущие приложения для проведения научных расчетов: GROMACS (расчет параметров белков) и GAUSSIAN (квантовая химия). Стоит заметить, что ядро GROMACS активно используется в известнейшем проекте Folding@home, поэтому полученные результаты будут интересны для начинающих «фолдеров».

Для полноты картины была добавлена одна синтетическая программа RAMSpeed для измерения пропускной способности памяти, протестирована производительность в мультипоточном бенчмарке, встроенном в 7zip, а также проведены замеры времени сжатия папки в BZIP и времени компиляции программы в gcc на примере сервера Apache.

Что касается работающих в Windows профессионалов – они ни в коем случае не были забыты.

Специально для них на платформе Windows 7 x64 было измерено время наложения нескольких фильтров и конвертации HD записи из формата AVCHD 720p в формат WMV, пригодного по объему для передачи через интернет (30-секундный исходник был взят из стандартных видео Windows) при помощи столь любимой автору Sony Vegas Pro 9.0 x64, а также время конвертации 38 FLAC файлов в формат MP3. В дополнение к этому фиксировались время сжатия папки объемом 321 Мбайт, содержащей .psd и .doc файлы в формат ZIP с помощью 7zip, скорость мультипоточного бенчмарка, встроенного в 7zip (в т.ч. для сравнения скорости в Windows и Linux), а «на сладкое» был припасен рендеринг сцены в Autodesk 3ds Max 2010 x64 (небольшая тестовая сцена содержит 5281 фигурку Дарта Вейдера, что составляет в сумме 6 090 144 вершин, рендеринг производился в формат HDTV с антиалайзингом и продвинутым Radiosity освещением).

Каждый тест прогонялся три раза, все программы использовали одинаковые бинарные файлы, т.е. не делалось оптимизаций под конкретную архитектуру процессора. Конечно же, как наиболее современные, использовались ОС Windows 7 и ОС Linux 64-битной архитектуры, и абсолютно все программы, подобранные для тестов, были скомпилированы с использованием 64-разрядности.

Тестовые стенды

В нашем случае, чтобы соответствовать имиджу рабочих станций, рассчитанных на экономного профессионала, для тестовых стендов были использованы производительные, но не самые топовые компоненты и, как следствие, не так сильно ударяющие по бюджету любителей производительных компьютеров.

Начнем с платформы AMD Deneb:

  • Материнская плата: ASUS M4A79 Deluxe, BIOS version 2708;
  • Центральный процессор: AMD Phenom II X4 940BE, Socket AM2+, 3.0 ГГц in stock, 3.4 Ггц in O/C, 1.5 В;
  • Оперативная память: 8 Гбайт (2 ГБ x 4) OCZ OCZ2P10662G, DDR2 PC8500 (1066 МГц) DIMM CL5 5-5-5-15-26-2T (2.1 В).

Общая стоимость: примерно $480 по состоянию на июнь 2010 года.

Теперь пришло время конкурентов, между которыми тоже разыграется нешуточная битва.

Платформа Intel Bloomfield:

  • Материнская плата: ASUS P6T Deluxe, BIOS version 2101;
  • Центральный процессор: Intel Core i7 920, степпинг D0, LGA1366, 2.66 ГГц in stock, 3.4 и 4.2 ГГц in O/C, 1.2-1.4 В. Hyper-Threading off;
  • Оперативная память: 6 Гбайт (2 ГБ x 3) OCZ OCZ3P1333LV6GK, DDR3 PC310666 (1333 МГц) DIMM CL7 7-7-7-24 (1.65 В).

Общая стоимость: примерно $720 по состоянию на июнь 2010 года.

Платформа Intel Lynnfield:

  • Материнская плата: Gigabyte GA-P55-US3L, BIOS version F3;
  • Центральный процессор: Intel Core i5 750, B1, LGA1156, 2.66 ГГц in stock, 3.4 ГГц in O/C, 1.2 В;
  • Оперативная память: 6 Гбайт (2 ГБ x 3) OCZ OCZ3P1333LV6GK, DDR3 PC310666 (1333 МГц) DIMM CL7 7-7-7-24 (1.65 В).

Общая стоимость: примерно $500 по состоянию на июнь 2010 года.

Остальные компоненты, остававшиеся постоянными у всех наших испытуемых:

  • Система охлаждения: Thermaltake Big Typhoon VX, 1200 об\мин;
  • Термоинтерфейс: КПТ-8;
  • Видеокарта: 1 ГБ Sapphire Radeon HD 4870 Vapor-X;
  • Жёсткий диск: Seagate ST3750330AS (750 ГБ);
  • Блок питания: COOLER MASTER Silent Pro 600 Вт;
  • Корпус: Thermaltake Xaser V.

Разгон

Для проведения корректного сравнения различных платформ была замерена производительность как при стандартных частотах, так и в разгоне при одинаковой частоте. За последнюю была взята «скромная частота» в 3.4 ГГц, не требующая особых изысканий при своем достижении, в том числе и на платформе AMD, ведь ни для кого не секрет, что профессионалы не слишком охотно подвергают свои системы оверклокингу. Но мы были бы не оверами, если в качестве дополнительного тестирования на платформе Intel Core i7 920 не провели короткий бенч-забег при максимальной частоте, при которой воздушное охлаждение еще без проблем справлялось с процессором - 4.2 ГГц. В него вошли некоторые Linux-приложения и все приложения под платформу Windows 7 x64.

Наконец, ниже приведены снимки главного окна программы CPU-Z для всех режимов работы тестовых платформ.

AMD Phenom II X4 940 Black Edition:


Intel Core i5 750:


Intel Core i7 920:


Intel Core i7 920 был разогнан до 4.2 ГГц чтобы узнать, насколько серьезный разгон увеличит его производительность:

Тестирование производительности

Пропускная способность памяти

Итак, приступим к нашим многочисленным тестам. Первым из синтетических приложений был выбран тест на определение пропускной способности памяти. Для этого использовалась программа RAMSpeed под Linux.

RAMSpeed, Linux


Очки, больше - лучше

Как и можно было предполагать, лидирующие позиции в этом тесте безоговорочно занимает платформа i7 и i5, благодаря встроенным трех- и двух- канальным контроллерам памяти, соответственно. Разгон практически не влияет на конечный результат, за исключением платформы AMD.

Посмотрим, как пропускная способность памяти повлияет на скорость в остальных приложениях.

Сжатие данных

Производительность при сжатии данных – вот, за что любят четырехъядерные процессоры как обычные пользователи, так и профессионалы.

Мы измерили время сжатия папки в BZIP под Linux, ZIP под Windows, а также скорость многопоточного бенчмарка, встроенного в 7-zip, причем под обе ОС. Полученные результаты:

BZIP, Linux


Секунды, меньше -лучше

Приятная неожиданность – при стандартных частотах время сжатия папки в программе BZIP у AMD 940BE оказалось меньше, чем у прямого конкурента – i5 750. Впрочем, у i7 920 обнаруживается явное преимущество перед обоими соперниками. В разгоне время AMD 940BE не сильно уменьшается, но в тех же условиях конкуренты - как i5 750, так и i7 920 сильно прибавляют в скорости, что позволяет нам присудить им безоговорочную победу.

ZIP, Linux


Секунды, меньше - лучше

Совсем не похожая на предыдущую ситуация наблюдается в ZIP под ОС Windows. Как мы видим, процессор от AMD легко обходит оба процессора из враждебного лагеря при стандартных частотах. Лишь в разгоне i7 920 удается сравниться со своим соперником. Впрочем, разница между тремя процессорами лежит в пределах пары секунд, но, тем не менее, мы оставим победу за АМД. Как вы видите, на этом графике появляется и наш последний конкурсант – i7 920 при большом разгоне. Он сразу же показывает, кто в доме папа, срезая нижнюю планку еще на две секунды.

7-zip multithreaded benchmark (Windows)


MIPS, больше - лучше

Скорость многопоточного бенчмарка, встроенного в 7-zip, является отличным показателем, который, к тому же, получить достаточно просто и быстро. Посмотрев на результаты, сложно без раздумий отдать победу лагерю «синих». Процессоры Intel в ОС Windows лишь в разгоне одерживают победу. При штатных частотах процессор AMD 940BE выглядит куда более интересно, чем оба своих конкурента. Естественно, серьезно разогнанный i7 920 выглядит настоящим гигантом, опережая всех на добрых три тысячи MIPS.

7-zip multithreaded benchmark (Linux)


MIPS, больше - лучше

Что касается производительности процессоров в ОС Linux, она удивляет нас и оказывается ниже, чем в первой ОС. Это можно объяснить лишь нежеланием авторов оптимизировать свой код в Linux. Результаты здесь более предсказуемы – процессоры Intel оказываются быстрее как на штатных частотах, так и в разгоне.

Серверная производительность

Наконец мы отходим от синтетических и полусинтетических тестов и с головой погружаемся в суровую реальность. Скорость работы с OpenSSL RSA показывает нам, насколько хорошо наши конкурсанты справляются с задачами на шифрование информации.

OpenSSL RSA encryption, Linux


Очки, больше - лучше

Как можно видеть, маркетологи AMD не обманывали, когда говорили об эффективности своих процессоров в серверном секторе. Более подробно мы поговорим об этом во второй части нашей статьи, но для начала процессор от AMD показывает просто замечательный результат, обходя обоих конкурентов даже в штатном режиме.

Программирование

Многие программисты до сих пор занимаются разработкой на своих старых, привычных и удобных ноутбуках. Время компиляции серьезного проекта может отнять действительно много времени. Посмотрим, насколько хорошо справляются наши участники с этой нагрузкой.

Apache httpd compilation, gcc, Linux


Секунды, меньше - лучше

В этом тесте уже процессоры Intel вырывают пальму первенства. Делаем вывод – для разработчиков платформа Intel остается более предпочтительной. При одинаковом разгоне разница достигает 18 секунд не в пользу лагеря «красных».

Кодирование аудио

Поговорим о более интересных вещах – о мультимедиа. С задачей кодирования (сжатия) аудио файлов мы сталкиваемся очень часто. Тем интересней будет посмотреть, какая из платформ – участниц сегодняшнего теста покажет лучшие результаты.

LAME encoding, Linux


Секунды, меньше -лучше

Снова ничего удивительного. В популярном пакете LAME MP3 процессор AMD оказывается чуть-чуть быстрее при штатной частоте, а Intel i7 920 при одинаковом разгоне.

OGG encoding, Linux


Секунды, меньше - лучше

Wavpack encoding, Linux


Секунды, меньше - лучше

Аналогичная ситуация наблюдается и в пакетах OGG и Wavpack.

Monkey Audio encoding, Linux


Секунды, меньше - лучше

А вот в пакете для сжатия музыки без потерь Monkey Audio процессоры Intel оказываются быстрее, чем их визави во всех режимах.

FLAC encoding, Linux


Секунды, меньше – лучше

Surprise! В самом популярном среди меломанов пакете для сжатия музыки без потерь, FLAC, платформа AMD оказывается заметно быстрее своих конкурентов, как в разгоне, так и без. Я лично для себя на этом тесте сделал определенные выводы…

Теперь выясним, будет ли различаться расстановка сил при кодировании аудио в ОС Windows.

FLAC to MP3 encoding, Windows


Секунды, меньше – лучше

Без шансов для AMD. Четырехъядерники от Intel быстрее во всех режимах.

Кодирование видео

Начинается самое вкусное. Обратимся сразу к результатам наложения фильтров и сжатия 30-секундного видео отрывка в формат WMV.

Sony Vegas HD Video encoding to WMV, Windows


Секунды, меньше – лучше

На этих графиках прекрасно видно две вещи - 1) разгон решает все и 2) HD камер больше можно не бояться. Профи ликуют, пессимисты нервно ждут в сторонке и курят в ожидании следующей технической революции. Но вернемся к нашему тесту – снова на коне процессоры от Intel. При этом выигрыш от серьезного разгона i7 920 составляет около двух (!) минут при общем времени кодирования в пять минут. Чем не повод для апгрейда?

Нам остаются два эксклюзивных пакета тестовых программ – для научных расчетов и 3D моделирования. Что же, ознакомимся с результатами.

Научные расчеты

Были использованы программы GROMACS и GАUSSIАN.

GROMACS Lyzosome, Linux


Гфлопс, больше - лучше

В GROMACS измеряется количество Гигафлопс (GFlops), показатель, по которому (правда, в других программах и размерностях) меряются все суперкомпьютеры. Результаты не слишком обнадеживающие для лагеря AMD. Intel однозначно быстрее во всех режимах. Для интереса мы даже провели тесты при сильном разгоне системы Intel Core i7 920. Результат оказался внушительный. Теперь мы знаем, на что могут опираться участники распределительных вычислений.

GАUSSIАN, Linux


Секунды, меньше – лучше

Впервые была измерена скорость расчетов в квантовохимической расчетной программе GАUSSIАN. Программа очень агрессивно использует оперативную память и ресурсы процессора. При серьезных расчетах 24/7 даже самые отлаженные системы начинают валиться через пару месяцев. Стоит отметить, что программа написана на Fortran и прекрасно распараллеливается. Однако при этом она явно заточена под Intel. В этом можно убедиться, посмотрев на графики. Платформа AMD снова отстает. При этом разрыв между i7 920 и i5 750 совсем небольшой. Конечно же, при серьезном разгоне мы видим существенное сокращение времени, затрачиваемого на расчет. Ученые могут радоваться!

3D моделирование

В заключение мы хотели бы привести вам пару результатов из самых известных программ для 3D моделирования и из двух их бесплатных аналогов.

Начнем с Linux – нас ждут MAYA, Blender Render и Raytrace Rendering.

MAYA 2008, Linux


Секунды, меньше – лучше

В MAYA решительное преимущество на стороне Intel. Результаты не так сильно меняются от разгона, как в предыдущих приложениях, хотя это все равно не помешает нам сэкономить полминуты на каждые две минуты рендеринга.

Blender Render, Linux


Секунды, меньше – лучше

В Blender Render, которую обожают использовать независимые 3D-художники и аниматоры, результаты такие же, лишь разрыв между Intel и AMD меньше бросается в глаза.

Software Raytrace Rendering, Linux


Секунды, меньше – лучше

В Raytrace Rendering мы наблюдаем ту же картину.

Как видно, в ОС Linux программы для 3D моделирования дружно отдают пальму первенства платформе Intel, а точнее Intel Core i7 920.

Autodesk 3DS Max 2010 rendering, Windows


Секунды, меньше – лучше

И в популярнейшем пакете от Autodesk – 3DS Max 2010 мы видим ту же картину, лишь в штатном режиме AMD 940BE обгоняет i5 750, но уже в небольшом разгоне платформа Intel забирает золото. Разогнанный немного сильнее i7 920 позволяет скостить 10 секунд из 86, что, в общем, вполне неплохо.

Заключение

Итак, дорогие друзья – оверы, профессионалы, любители, писатели и читатели. Подошла к концу первая часть статьи, в которой мы рассмотрели десктопные процессоры для построения рабочих станций и серьезной работы от AMD и Intel. Где-то быстрее одни, где-то другие «камни», но в целом наблюдается весомое преимущество платформы от Intel во всех приложениях, кроме кодирования аудио, шифрования и сжатия данных. Главный вывод состоит в том, что на данный момент невозможно однозначно дать ответ на вопрос, что стоит покупать профессионалу. Но мы надеемся, что благодаря нашим обширным тестам вы сможете сделать адекватный выбор, и вам не придется на себе примерять фразу, которую мы вынесли в эпиграф.

Спасибо за внимание и до встречи во второй части статьи, где мы сравним производительность самых последних, топовых серверных платформ обеих компаний и попробуем разобраться, стоит ли покупать сервер по цене, сопоставимой с ценой нескольких домашних рабочих станций.

Автор выражает благодарность donnerjack, Phoenix_, Лакс (НАВАХУ), K-A-A, а также остальным авторам и рецензентам. Также отдельное спасибо Vice и кафедре Химии и Технологии Элементоорганических соединений Московской Государственной Академии Тонкой Химической Технологии им. М.В. Ломоносова и лично Гордееву Е. за оказанную помощь и поддержку.

Вторая часть - здесь.

Iliapan