КОМЬЮТЕРНАЯ ПЛАТФОРМА С ПРОЦЕССОРОМ AMD Athlon™ 64 ДЛЯ НАУЧНЫХ РАСЧЁТОВ

для раздела Блоги

Работа для конкурса AMD+Overclockers.ru


Эта работа является результатом моего подбора компьютерной платформы рабочей станции для проведения научных расчётов механики ударов твёрдых тел проведенного в конце 2004 г – начале 2005 г.

Введение

В настоящее время в механике ударов твёрдых тел довольно широкое применение получило компьютерное моделирование, которое позволяет проводить численные эксперименты ударов твёрдых тел сидя за компьютером и избежать натурных экспериментов или уменьшить их количество.

Поэтому такой подход получил широкое распространение в автомобильной промышленности (удары и столкновения автомобилей, защита пассажиров подушками безопасности и т.д.), аэрокосмической промышленности (удар птицы по конструкции летательного аппарата или её попадание в газотурбинный двигатель и т.д.) и технологии машиностроения (обработка металлов давлением, резание и т. д.). Причём это перечислены далеко не все возможные сферы применения.

В качестве программных средств рабочих станций применяются специализированные CAE комплексы, которые используют метод конечных элементов (ANSYS, LS-Dyna, Nastran, Dytran и другие).
Расчёты ударов твёрдых тел с помощью метода конечных элементов требуют довольно больших вычислительных ресурсов. Так, например, время выполнения одного расчёта может занимать от нескольких часов до одного месяца в зависимости от сложности решаемой задачи и производительности используемой рабочей станции. Поэтому для этого применяются рабочие станции, которые, как правило, в качестве аппаратных средств используют многопроцессорные компьютерные платформы (количество центральных процессоров больше одного) и кластеры. Такие мощные и дорогие компьютерные платформы доступны только солидным конструкторским и научно-исследовательским организациям, но не доступны, как правило, для аспирантов учебных заведений (которым я некогда являлся).
Поэтому для выполнения моих научных расчётов механики ударов твёрдых тел потребовалась более простая рабочая станция, которая должна обладать хорошей производительностью и умеренной стоимостью. Мой выбор был сделан в пользу рабочей станции на базе однопроцессорной компьютерной платформы как более дешёвой.

1. Анализ имеющихся рекомендаций по подбору компьютерной платформы и аппаратных средств рабочей станции

На сегодняшний день многие фирмы–изготовители компьютерной техники предлагают для CAD CAM CAE уже готовые решения рабочих станций и размещают на своих сайтах о них информацию, а также иногда и результаты тестирования своих рабочих станций. Особенно сравнительно много информации о рабочих станциях для CAD, что нельзя сказать о решениях для CAE, интересующих меня.

Среди имеющейся информации о компьютерных платформах рабочих станций для CAE можно выделить сайт компании-изготовителя ARBYTE (готовые решения) и компании CAD-FEM GmbH (рекомендации по подбору), которая продаёт CAE программное обеспечение.

Также была изучена информация на разных компьютерных сайтах (в том числе и www.overclockers.ru), которые приводят результаты тестирования производительности рабочих станций, в том числе и в научных расчётах.

Тестирование рабочих станций при выполнении научных расчётов выполняют, как правило, при помощи научных тестов ScienceMark, в которых пальму первенства имеют компьютерные платформы с центральными процессорами AMD.

Всё это конечно позволяет в какой-то мере составить рекомендации по подбору необходимой компьютерной платформы и аппаратных средств рабочей станции. Однако достичь ясности, какой должна быть компьютерная платформа (центральный процессор, системная (материнская) плата, объём оперативной памяти и т.д.) для выполнения моих научных расчётов механики ударов твёрдых тел не представляется возможным.

Для достижения этого, было решено оценить производительность доступных мне рабочих станций при помощи созданных мною двух специальных тестов, после чего возможно будет сделать вывод о необходимой компьютерной платформе рабочей станции для проведения научных расчётов механики ударов твёрдых тел.

2. Краткое описание тестов

Тесты рассматривали решение задачи удара упругой сферы по пластически деформируемой пластине (рисунок 1).



Рисунок 1 - Задача удара упругой сферы по пластически деформируемой пластине (поперечное сечение)


Первая тестовая задача TRANS (3d модель, 16770 степеней свободы) использует для решения неявный метод интегрирования уравнения динамики (схема Ньюмарка).

Вторая тестовая задача DYNAM (3d модель, 67080 степеней свободы) использует явный метод (метод рекуррентных соотношений), который в настоящее время, наиболее распространен при решении задач ударов и является более «быстроходным» методом их решения по сравнению с неявным.
Используемые конечно-элементные модели представлены на рисунках 2а и 2б.



Рисунок 2а - Используемая конечно-элементная модель в тесте TRANS



Рисунок 2б - Используемая конечно-элементная модель в тесте DYNAM


Тесты были реализованы в виде макрофайла, который, используя команды и численные алгоритмы конечно-элементного программного комплекса, осуществляет построение конечно-элементных моделей, определяет их параметры, управляет процессом решения и определяет время выполнения тестов.

3. Методика тестирования

Тестирование выполнялось следующим образом: сначала на тестируемую рабочую станцию устанавливался конечно-элементный программный комплекс, затем из под его приложения запускался макрофайл тестов.

По продолжительности выполнения тестов оценивалась производительность рабочей станции (чем меньше продолжительность – тем выше производительность). Продолжительность выполнения каждого теста рассчитывалась как разность времени начала и конца расчёта задачи.
Тестирование на каждой рабочей станции выполнялось по три раза. После чего выбирался лучший результат.

4. Тестированные рабочие станции

Я провёл тестирование 9-ти рабочих станций с компьютерными платформами разного поколения с центральными процессорами (таблица 1):

- Intel Celeron,
- Intel Pentium 4 (с технологией Hyper-Threading (HT) и без)
- AMD Athlon (включая Athlon 64).

Все рабочие станции работали под операционной системой Windows 32 bit.



(кликните по картинке для увеличения)

Таблица 1 - Компьютерные платформы тестируемых рабочих станций


5. Результаты тестирования

Результаты тестирования рабочих станций в тестовой задаче TRANS представлены на диаграмме (рисунок 3), в которой по оси ординат представлены относительные величины производительности, причём за 100 % принималось время выполнения тестовой задачи рабочей станции лидера.



Рисунок 3 – Тест TRANS (100% это 1861 с)


Лидером является рабочая станция с центральным процессором AMD Athlon 64 3000+ частотой 2 Гц и оперативной памятью 1Гб.

Второе место также за рабочей станцией с центральным процессором от AMD Athlon XP 2500+ частотой 1,5 Гц и объёмом оперативной памяти 512 Мб.

Третье место за рабочей станцией с центральным процессором Intel Pentium 4 с частотой процессора 2,8 Гц и объёмом оперативной памяти 512 Мб.

Рабочие станции на базе процессоров Intel Celeron безнадёжно отстали.
Нельзя также, не обратить внимание на то, что рабочие станции на базе процессора Intel Pentium 4 с технологией НТ с частотой процессоров 3 Гц и 2,4 Гц имеют меньшую производительность, чем рабочая станция с частотой процессора 2,8 Гц и без НТ.

А также на то, что рабочие станции Pentium 4 НТ с разной частотой процессора 3 Гц и 2,4 Гц имеют одинаковую производительность, не смотря даже на то, что рабочая станция с частотой процессора 3 Гц имеет в 4 раза большую оперативную память и системную плату на базе чипсета i875, включающего в себя технологию PAT (таблица 1).

Результаты тестирования рабочих станций в тестовой задаче DYNAM представлены на рисунке 4. Здесь, к сожалению, отсутствуют данные по рабочей станции с процессором Pentium 4 с частотой 2,8 Гц. Снова можно отметить превосходство рабочих станций с центральными процессорами AMD Athlon и практически одинаковый результат рабочих станций Pentium 4 НТ 3,0 и 2,4 Гц.



Рисунок 4 – Тест DYNAM (100% это 150 с)


Я был удивлён проигрышем мощной и более дорогой рабочей станции с процессором Intel Pentium 4 c частотой 3000 Гц, обладающей технологией Hyper-Threading, основной смысл которой заключается в поддержке многопотокового исполнения программ. То есть технология Hyper-Threading позволяет на одном физическом процессоре одновременно исполнять два задания или два фрагмента кода одной программы-приложения. Таким образом, один процессор воспринимается операционной системой как два логических устройства, интенсивная работа которых осуществляется параллельно.

По информации из различных источников, технология Hyper-Threading позволяет повысить производительность системы и улучшить ее отклик в многозадачных средах при работе одновременно с несколькими программами-приложениями (особенно офисных, кодирования аудио- и видеофайлов). Например, пользователь, работающий с несколькими программами-приложениями одновременно, получает повышение производительности, достигнутое за счет улучшения возможностей системы выполнять одновременно две задачи (рисунок 5).



Рисунок 5 – Hyper-Threading от Intel в действии (по данным журнала «Компьютерное обозрение» №5 (423) 3 февраля 2004)


В тоже время, известно, что программы-приложения для научных и инженерных расчётов, как правило, не оптимизированы (или слабо оптимизированы) для работы в многопотоковом режиме (даже до сих пор).

Поэтому дополнительно было проведено исследование влияния технологии Intel виртуальной многоядерности Hyper-Threading на производительность рабочей станции с центральным процессором Intel Pentium 4 с частотой 3,0 Гц с выключенной в BIOS Hyper-Threading.

В результате мы получили рост производительности при выключении Hyper-Threading (рисунки 6 и 7), что даёт возможность сделать вывод о практической бесполезности этой технологии при проведении данных научных расчётов без специальной оптимизации используемого конечно-элементного программного комплекса.



Рисунок 6 – Тест TRANS рабочей станции с центральным процессором Intel Pentium 4 с частотой 3,0 Гц (100% это 2113 с)



Рисунок 7 – Тест DYNAM рабочей станции с центральным процессором Intel Pentium 4 с частотой 3,0 Гц (100% это 179 с)


Сама Intel при обсуждении недостатков технологии Hyper-Threading, сравнивает её с поваром, который готовит два блюда на двух разных конфорках. Причём двухъядерный процессор она сравнивает с двумя поварами, готовящими блюда на независимых газовых плитах. Отсюда, становится очевидным, что второй подход обеспечивает более высокую производительность.

Таким образом, при выключении Hyper-Threading рабочая станция с центральным процессором Intel Pentium 4 HT с частотой 3,0 Гц вырывается вперёд и обходит рабочую станцию с AMD Athlon XP-A 2500+ (рисунки 8 и 9). Но рабочая станция с центральным процессором AMD Athlon 64 3000+ всё равно для неё не досягаема.



Рисунок 8 – Тест TRANS (100% это 1861 с)



Рисунок 9 – Тест DYNAM (100% это 150 с)


6 Рекомендации по выбору компьютерной платформы по результатам тестирования, а также мои личные соображения

В качестве компьютерной платформы для выполнения моих научных расчётов механики ударов твёрдых тел я выбрал по результатам тестов платформу рабочей станции лидера с центральным процессором AMD Athlon 64 3000+. Поэтому советую всем, кто занимается подобными CAE научными расчётами обратить пристальное внимание на процессоры AMD Athlon 64.

В качестве системной платы можно в принципе использовать материнские платы любых производителей для процессоров AMD Athlon 64 (754 или 939 разъём), так как процессоры AMD Athlon 64 имеют интегрированный в ядро кристалла контролер оперативной памяти, а, следовательно, производительность пары «процессор – системная плата» оценивается однозначно только рейтингом процессора.

В качестве чипсета материнской платы следует обратить своё внимание на чипсеты VIA K8T900, nForce4 Ultra и их дальнейшие развития, которые имеют поддержку интерфейса жёстких дисков SATA 2.0, что иногда очень важно при использовании неявных методов решения, когда происходит большое количество циклов записи-чтения на жёсткий диск и, как правило, файлов этапов расчёта большого размера (иногда сотни Мб).

Для научных расчётов необходимо использование больших объёмов оперативной памяти, что особенно важно при использовании явных методов решения. Поэтому чем больше объём оперативной памяти, тем лучше. Таким образом, это требование распространяется и на системные платы по наличию необходимого числа слотов для модулей оперативной памяти.

7 Основные перспективы дальнейшего прогресса однопроцессорных компьютерных платформ для научных расчётов

Основными, на мой взгляд, перспективами дальнейшего прогресса однопроцессорных компьютерных платформ для научных расчётов, которые на порядок могут поднять производительность, является следующее:

- применение двухядерных процессоров с двумя и более физическими ядрами в комплексе с соответствующей оптимизацией конечно-элементных программных комплексов;

- применение 64 битных операционных систем (и соответственно 64 битных конечно-элементных программных комплексов) которые позволяют использовать больше оперативной памяти в процессе вычисления, что особенно важно при использовании явного решателя;

- применение большого количества модулей памяти и их объёма (применение системных плат с возможностью установки более 4 модулей памяти и применение модулей памяти более 1 Гб).

Выводы

В настоящей работе было проведено тестирование 9 рабочих однопроцессорных станций с компьютерными платформами разного поколения при выполнении научных конечно-элементных расчётов механики ударов твёрдых тел (использовались неявный и явный методы решения уравнений динамики).

В результате тестирования было определено, что рабочая станция с компьютерной платформой с центральным процессором AMD Athlon 64 обладает наибольшей производительностью.

Представлены рекомендации по выбору компьютерной платформы на базе процессора AMD Athlon 64, а также основные перспективы дальнейшего прогресса однопроцессорных компьютерных платформ для научных расчётов.

О себе: Мечтаю работать в AMD. В настоящее время провожу тестирование двухпроцессорных рабочих станций и однопроцессорных двухядерных рабочих станций при выполнении научных расчётов, а также занимаюсь высокопроизводительными вычислениями на кластере (конечно-элементная модель более 1 млн. степеней свободы), созданном совместно с моим товарищем. Но это уже другая история…

Украина, Запорожье, 14 мая 2006 г.

Telegram-канал @overclockers_news - это удобный способ следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают