GeForce 460GTX и необходимость SSE. Глобальное исследование процессорозависимости. Часть 2.

для раздела Блоги
Max1024 07.11.2010


После написания первой части статьи о работе GeForce 460GTX на платформе Pentium-I стало очевидным, что причина невозможности запуска разнообразного софта заключается в отсутствии поддержки у процессоров AMD K6 и Intel Pentium MMX набора команд SSE. Чтобы развеять все споры на этот счет я решился на 2-й этап своего тестирования.
Для моих экспериментов мне дали на время Pentium-III платформу в виде:

CPU – Intel Pentium-III Celeron 1.2Ghz (ядро Tualatin)

MB – Acorp 694TA (VIA Apollo Pro133T)

RAM – 2 по 256Mb SDRAM PC133

EVGA GeForce 460GTX 1Gb c переходным мостом

HDD – Seagate Barracuda IV 40Gb

Блок питания – FSP ATX-450 450W



Для разнообразия эксперимента я решил добавить к сравнению флагмана 2001-го года GeForce 3 Ti500 производства Leadtek. Частоты 240/500Mhz, 64 Mb видеопамяти, поддержка шейдеров v 1.1, Карта работала в режиме AGP 2х что дает в теории 533MB/s пропускной способности интерфейса. Посмотрим что победит 4-х кратное преимущество пропускной способности интерфейса AGP над PCI или технологичность архитектур GPU. Справочно: количество транзисторов GTX460 в 32 раза больше чем у GeForce3.

Еще не был разрешен в первой части статьи вопрос с использованием ускорением CUDA. Написанный Mathematic'om бенчмарк Cuda Factorial Benchmark v.4.0.1 на платформе Pentium-I у меня не пошел, не ясно как обстоят дела с ускорением HD video с использованием CUDA.

Так же для первой части у меня были подготовлены игры, которые не пошли, очевидно по техническим причинам, посмотрим что даст наличие SSE — DOOM3, Richard Burns Rally, Stalker:COP. Итак начнем.



GeForce 460GTX Vs GeForce 3 Ti500 (так и хочется добавить Fight!!! )

Чтобы посмотреть как сдерживает PCI интерфейс GeForce 460GTX и что дает его 4-х кратное преимущество GeForce 3 Ti500 запустим 3Dmark2001SE.







Awesome GeForce Ti 500! Я думаю победа GeForce Ti 500 в этом тесте именно из-за более скоростного AGP порта, но все-таки шейдерная архитектура GeForce 460GTX дает о себе знать в 4-м тесте Nature, где преимущество GeForce 460GTX над GeForce Ti 500 практически равно двум, по количеству кадров в секунду, но победы это 460-му это не принесло.


Посмотрим какая будет расстановка сил в 2003-м 3Dmarke.







Шейдеры, шейдеры, шейдеры вот из-за них Ti 500 и проиграл GTX460-му, хотя по количеству fps в первом тесте он одержал победу, но отсутствие поддержки шейдерной модели 2.0 и колоссальная мощь FERMI сделали свое дело. Что же, дальше GeForce 460GTX будет выступать в гордом одиночестве.










Что же в 2005-м мой тандем выступает чуть быстрее, чем Pentium 4 1.8Ghz в паре с GeForce GeForce 6600 LE, а в 2006-м как Pentium 4 3.0GHz с GeForce 6600 GT.


Посмотрим на результаты в Unigene Heaven Benchmark v.1.0

Запуск производился с минимальными настройками в разрешении 640*480 и с максимальными в 1280*1024.






Кто у нас самое слабое звено? CPU или PCI интерфейс? Мне кажется что последний.


От синтетики перейдем к играм.

Интересно можно ли поиграть в Stalker Call of Prypiat? Настройки и результат видны ниже.




Игрушке сразу не хватает всего, и мощного cpu, и скоростного обмена данными между CPU и GPU, единственное что радует, так это максимальный fps, а ведь его и могло не быть




DOOM3 и Richard Burns Rally, средний fps. Первый может использовать шейдеры 3.0, вторая 1.1




Ну наконец-то хоть во что-то можно будет поиграть хотя fps на пределе играбельности, и когда в кадре куча монстров то «средний» fps падает до минимального, но играть все же можно.


Практическая польза от CUDA.

В обсуждении первой части статьи было масса высказываний о бесполезности данной конфигурации. Отчасти я соглашусь, а отчасти нет. Просили меня проиграть какое-нибудь FullHD видео. Пожалуйста.

Итак тестовое видео это Трансформаторы: Месть падших, FullHD rip 1080p, кодек AVC, размер рипа 13.8Gb, поток 13.2 Mb/s. Рип воспроизводился последней версией KMplayer, в котором было включено аппаратное ускорение. Так получилось, что данный рип к тому же воспроизводился по локальной сети, что также повлияло на загрузку cpu.




Очень хороший результат, загрузка cpu не превысила и 65%. Я так же пробовал воспроизводить FullHD remux весом более 20Gb, в нем загрузка cpu была даже чуть меньше, что и понятно.


Теперь посчитаем факториал с помощью Cuda Factorial Benchmark v.4.0.1




Превосходство GPU над CPU более чем в 32 раза! Вот она реальна польза

Весь софт, что задействует CUDA при расчетах, может давать результат, а если учесть, что на большинстве устаревших материнских плат по 5 слотов PCI то перспектива, хоть и туманная надеюсь что есть


Выводы.

Из 2-х частей моего тестирования видно, что процессорозависимость ярко выражена, ну это и младенцу понятно при таком раскладе, мощнее cpu — выше результат, возможно пропускная способность PCI интерфейса еще сильнее влияет на производительность при более сильном cpu, что же проверить это можно, только установив GeForce 460GTX в AGP порт. Продолжение следует …


Обсудить.
Telegram-канал @overclockers_news - это удобный способ следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Оценитe материал

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают