GeForce 460GTX и необходимость SSE. Глобальное исследование процессорозависимости. Часть 2.
реклама
После написания первой части статьи о работе GeForce 460GTX на платформе Pentium-I стало очевидным, что причина невозможности запуска разнообразного софта заключается в отсутствии поддержки у процессоров AMD K6 и Intel Pentium MMX набора команд SSE. Чтобы развеять все споры на этот счет я решился на 2-й этап своего тестирования.
Для моих экспериментов мне дали на время Pentium-III платформу в виде:
CPU – Intel Pentium-III Celeron 1.2Ghz (ядро Tualatin)
MB – Acorp 694TA (VIA Apollo Pro133T)
RAM – 2 по 256Mb SDRAM PC133
EVGA GeForce 460GTX 1Gb c переходным мостом
HDD – Seagate Barracuda IV 40Gb
Блок питания – FSP ATX-450 450W
Для разнообразия эксперимента я решил добавить к сравнению флагмана 2001-го года GeForce 3 Ti500 производства Leadtek. Частоты 240/500Mhz, 64 Mb видеопамяти, поддержка шейдеров v 1.1, Карта работала в режиме AGP 2х что дает в теории 533MB/s пропускной способности интерфейса. Посмотрим что победит 4-х кратное преимущество пропускной способности интерфейса AGP над PCI или технологичность архитектур GPU. Справочно: количество транзисторов GTX460 в 32 раза больше чем у GeForce3.
Еще не был разрешен в первой части статьи вопрос с использованием ускорением CUDA. Написанный Mathematic'om бенчмарк Cuda Factorial Benchmark v.4.0.1 на платформе Pentium-I у меня не пошел, не ясно как обстоят дела с ускорением HD video с использованием CUDA.
Так же для первой части у меня были подготовлены игры, которые не пошли, очевидно по техническим причинам, посмотрим что даст наличие SSE — DOOM3, Richard Burns Rally, Stalker:COP. Итак начнем.
GeForce 460GTX Vs GeForce 3 Ti500 (так и хочется добавить Fight!!! )
Чтобы посмотреть как сдерживает PCI интерфейс GeForce 460GTX и что дает его 4-х кратное преимущество GeForce 3 Ti500 запустим 3Dmark2001SE.
Awesome GeForce Ti 500! Я думаю победа GeForce Ti 500 в этом тесте именно из-за более скоростного AGP порта, но все-таки шейдерная архитектура GeForce 460GTX дает о себе знать в 4-м тесте Nature, где преимущество GeForce 460GTX над GeForce Ti 500 практически равно двум, по количеству кадров в секунду, но победы это 460-му это не принесло.
Посмотрим какая будет расстановка сил в 2003-м 3Dmarke.
Шейдеры, шейдеры, шейдеры вот из-за них Ti 500 и проиграл GTX460-му, хотя по количеству fps в первом тесте он одержал победу, но отсутствие поддержки шейдерной модели 2.0 и колоссальная мощь FERMI сделали свое дело. Что же, дальше GeForce 460GTX будет выступать в гордом одиночестве.
Что же в 2005-м мой тандем выступает чуть быстрее, чем Pentium 4 1.8Ghz в паре с GeForce GeForce 6600 LE, а в 2006-м как Pentium 4 3.0GHz с GeForce 6600 GT.
Посмотрим на результаты в Unigene Heaven Benchmark v.1.0
Запуск производился с минимальными настройками в разрешении 640*480 и с максимальными в 1280*1024.
Кто у нас самое слабое звено? CPU или PCI интерфейс? Мне кажется что последний.
От синтетики перейдем к играм.
Интересно можно ли поиграть в Stalker Call of Prypiat? Настройки и результат видны ниже.
Игрушке сразу не хватает всего, и мощного cpu, и скоростного обмена данными между CPU и GPU, единственное что радует, так это максимальный fps, а ведь его и могло не быть
DOOM3 и Richard Burns Rally, средний fps. Первый может использовать шейдеры 3.0, вторая 1.1
Ну наконец-то хоть во что-то можно будет поиграть хотя fps на пределе играбельности, и когда в кадре куча монстров то «средний» fps падает до минимального, но играть все же можно.
Практическая польза от CUDA.
В обсуждении первой части статьи было масса высказываний о бесполезности данной конфигурации. Отчасти я соглашусь, а отчасти нет. Просили меня проиграть какое-нибудь FullHD видео. Пожалуйста.
Итак тестовое видео это Трансформаторы: Месть падших, FullHD rip 1080p, кодек AVC, размер рипа 13.8Gb, поток 13.2 Mb/s. Рип воспроизводился последней версией KMplayer, в котором было включено аппаратное ускорение. Так получилось, что данный рип к тому же воспроизводился по локальной сети, что также повлияло на загрузку cpu.
Очень хороший результат, загрузка cpu не превысила и 65%. Я так же пробовал воспроизводить FullHD remux весом более 20Gb, в нем загрузка cpu была даже чуть меньше, что и понятно.
Теперь посчитаем факториал с помощью Cuda Factorial Benchmark v.4.0.1
Превосходство GPU над CPU более чем в 32 раза! Вот она реальна польза
Весь софт, что задействует CUDA при расчетах, может давать результат, а если учесть, что на большинстве устаревших материнских плат по 5 слотов PCI то перспектива, хоть и туманная надеюсь что есть
Выводы.
Из 2-х частей моего тестирования видно, что процессорозависимость ярко выражена, ну это и младенцу понятно при таком раскладе, мощнее cpu — выше результат, возможно пропускная способность PCI интерфейса еще сильнее влияет на производительность при более сильном cpu, что же проверить это можно, только установив GeForce 460GTX в AGP порт. Продолжение следует …
Обсудить.
реклама
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Сейчас обсуждают