Обновляем стенд для тестирования SSD-накопителей: Intel Z77 против Intel Z170, Windows 7 против Windows 10, а также различия между объемами ОЗУ

12 ноября 2016, суббота 09:00
для раздела Лаборатория

Оглавление

Вступление

Данный материал смотрится несколько странно: обычно различные онлайн- и офлайн-издания не уделяют должного внимания своим тестовым стендам – это считается малозначительной деталью. Однако это – как посмотреть и по какому принципу подходить к теме тестирования.

Возьмем вопрос технической части. Лаборатория Overclockers.ru долгое время тестирует твердотельные накопители на постоянной основе, и этот материал является уже 139-м по счету за последние три с половиной года. Накоплена огромная база результатов, и любое изменение в конфигурации тестового стенда может сыграть злую шутку в плане сопоставления разных моделей.

288x450  33 KB. Big one: 1500x2342  350 KB

Но время идет. Являвшаяся три года назад вполне актуальной конфигурация из процессора Intel Core i5-2500K и материнской платы на базе набора системной логики Intel Z77 на сегодняшний день устарела не только с точки зрения маркетинга, но и технически, не предлагая интерфейс PCI-Express 3.0. Причем получилось так, что начала сбоить и материнская плата. Тем временем типичный объем оперативной памяти, установленный в ПК пользователей, вырос с 4 до 8 Гбайт. Суммарно это достаточный набор аргументов для того, чтобы произвести полное обновление тестового стенда с точки зрения аппаратной части.

Программная платформа также претерпела изменения. За это время свет увидели Windows 8 и Windows 8.1, и если им не удалось занять серьезные позиции на рынке, то с Windows 10 все вышло иначе: проталкиваемая всеми правдами и неправдами, чуть ли не насильно, ОС Windows 10 смогла стать лидером. По статистике игровой платформы Steam, данная операционная система установлена на почти 50% ПК, фиксируемых сервисом.

450x168  10 KB. Big one: 1164x434  67 KB

Windows 7 обеих редакций установлена примерно на трети ПК – число еще значительное, но явно сокращающееся и предпосылок для изменения этой тенденции не предвидится. Причем изменилось и отношение операционной системы к накопителям, в частности в отсылке команды TRIM и алгоритмах кэширования. Таким образом, тестовый стенд нуждается в обновлении программной части.

А посему встает очевидный вопрос, интересный и сам по себе, а не только с точки зрения служебных нужд сайта: насколько сильно изменятся результаты производительности твердотельных накопителей при таком кардинальном обновлении? Помимо поставленных вопросов стоит отметить, что мне неоднократно приходилось отвечать на различные вопросы по самим тестовым стендам (ведь их два, один используется для тестов производительности, второй – для проверки работы алгоритмов энергосбережения): как они собраны и какими принципами при этом пришлось руководствоваться. Поэтому данный материал нацелен еще и на это – ответить на неизбежно возникающие вопросы читателей.





Общая теория


Дисковая подсистема

В последние год-полтора на свет были выпущены новые аппаратные платформы, в основе которых лежат как развивающиеся старые идеи, так и абсолютно новые решения. Всего один пример: контроллер Phison S10 в сочетании с TLC NAND Toshiba.

Во-первых, впервые (простите за каламбур) SLC-кэширование операций записи встречено в SSD, не относящихся к OCZ, Toshiba и Samsung. Во-вторых, впервые потребительский рынок узнал, что TLC NAND в SSD бывает медленной: скорость записи за пределами SLC-буфера у конфигураций объемом 120-128 Гбайт составляет всего примерно 50 Мбайт/с, что практически втрое ниже, чем у Samsung 840 (еще без приставки «Evo») – первого массового розничного SSD на этом типе памяти.

А есть вариант еще страшнее в буквальном смысле слова: Crucial BX200 даже в модификации объемом 240 Гбайт записывает лишь со скоростью 30 Мбайт/с.

450x303  23 KB. Big one: 812x547  24 KB

Да, SLC-буфер обычно приличный: его размер, в зависимости от объема SSD, может составлять несколько гигабайт (величина задается в процентах от объема накопителя в целом), чего в обыденной эксплуатации, как правило, хватает. Тем более что данные при обычной работе за домашним ПК пишутся не единым потоком, а поступают на накопитель небольшими порциями, между которыми присутствуют паузы, в течение которых микропрограмма контроллера накопителя успевает расчистить место, и к моменту поступления новых данных накопитель готов уже в полной мере.

Горькое прозрение у пользователя наступает в тот момент, когда у него возникает необходимость скопировать некоторый приличный объем данных, превышающий размер SLC-буфера.





450x294  51 KB. Big one: 1111x726  63 KB

Тесты на базе специализированных приложений (бенчмарков), вроде Iometer, при правильном подборе настроек отлично выявляют подобные особенности, но их наглядность и простота понимания для неискушенных в теме пользователей довольно спорны.

Именно поэтому в тестах на устойчивость скоростных характеристик и работы SLC-режима (если он есть) мною используется не только «синтетика» но и реальное копирование файлов – так, как это видит обычный пользователь.

449x287  8 KB

Но проблема в том, что SLC-режим реализовывается не только в SATA-решениях, с лета 2016 года его можно обнаружить и среди PCI-e SSD. Таковы, например, уже выпущенный Intel 600p и анонсированный Samsung 960 Evo. Достаточно открыть спецификации последнего, чтобы понять: KingFast F8M 256 Гбайт, прослужившим верой и правдой нам больше двух лет, уже не обойтись – 1900 Мбайт/с он, являясь решением SATA 6 Гбит/с, никак не обеспечит. Samsung 960 Pro, по словам производителя, хотя и ненамного, но еще быстрее на записи – до 2100 Мбайт/с.

Поэтому нам требуется включить в состав тестового стенда производительный PCI-e SSD, способный отдавать файлы с не меньшей скоростью. В качестве такового будет задействован нашедшийся в моих запасах Samsung SM951 256 Гбайт.

Процессор

Именно от него зависит производительность, демонстрируемая SSD в тестах мелкоблочных записи и чтения – ведь все пакеты данных еще необходимо подготовить перед отправкой на устройство. Наиболее производительными на данный момент процессорами массового сегмента рынка являются Intel Skylake. Решения AMD не подходят по той простой причине, что обладают меньшим уровнем быстродействия, попытка компенсации которого путем разгона приводит к повышенному тепловыделению и фактически к усложнению эксплуатационных характеристик тестового стенда (массивная СО, шум, энергопотребление). А LGA 2011-3 – относительно малораспространенная платформа.





Для пробного теста возьмем Intel Core i5-6600K, у которого мы будем варьировать число активных ядер (два или четыре) и их частоту (от 3500 до 4700 МГц). Для замера производительности задействуется специализированное приложение Iometer, в котором мы создадим и будем запускать два сценария: один из них отвечает за чтение, а другой – за запись. Оба этих сценария будут генерировать операции случайного доступа блоками данных объемом 4 Кбайт с глубиной очереди от 1 до 64. Каждый тест будет выполняться одну минуту, а за результат будет считаться среднее значение по ежесекундно снимаемым показателям производительности. В качестве тестируемого накопителя выступает признанный «король» рынка потребительских SSD – Samsung 950 Pro объемом 512 Гбайт.

Сценарий «Чтение блоками 4 Кбайт со случайным доступом и глубиной очереди от 1 до 64»

Режим работы
QD=1
QD=2
QD=4
QD=8
QD=16
QD=32
QD=64
Core i5-6600K@ 3500 МГц, 2 активных ядра
13 471
26 904
52 209
100 058
143 146
144 344
144 131
Core i5-6600K@ 3500 МГц, 4 активных ядра
13 549
27 043
52 806
98 972
144 737
148 315
149 108
Core i5-6600K@ 4000 МГц, 2 активных ядра
13 630
27 456
53 539
101 118
170 326
169 782
170 137
Core i5-6600K@ 4000 МГц, 4 активных ядра
13 789
27 520
53 687
101 011
167 044
169 886
169 302
Core i5-6600K@ 4400 МГц, 2 активных ядра
13 784
27 565
53 724
101 000
175 173
178 779
178 224
Core i5-6600K@ 4400 МГц, 4 активных ядра
13 884
27 769
54 273
102 029
175 863
186 653
184 952
Core i5-6600K@ 4700 МГц, 2 активных ядра
13 952
27 920
54 449
101 758
178 366
189 913
189 590
Core i5-6600K@ 4700 МГц, 4 активных ядра
14 042
28 065
54 769
102 952
179 125
197 720
198 463


Сценарий «Запись блоками 4 Кбайт со случайным доступом и глубиной очереди от 1 до 64»

Режим работы
QD=1
QD=2
QD=4
QD=8
QD=16
QD=32
QD=64
Core i5-6600K@ 3500 МГц, 2 активных ядра
45 320
96 562
101 139
100 575
100 857
100 820
101 147
Core i5-6600K@ 3500 МГц, 4 активных ядра
45 391
87 836
102 848
102 762
102 415
102 693
102 601
Core i5-6600K@ 4000 МГц, 2 активных ядра
48 393
101 019
101 720
100 660
101 345
102 040
102 227
Core i5-6600K@ 4000 МГц, 4 активных ядра
48 329
93 876
101 710
101 964
101 421
101 395
101 554
Core i5-6600K@ 4400 МГц, 2 активных ядра
49 229
100 139
101 379
101 542
101 792
101 149
101 314
Core i5-6600K@ 4400 МГц, 4 активных ядра
50 002
96 514
101 474
101 820
101 761
101 765
101 886
Core i5-6600K@ 4700 МГц, 2 активных ядра
50 962
100 369
101 530
102 124
102 227
102 058
101 974
Core i5-6600K@ 4700 МГц, 4 активных ядра
51 358
98 905
101 273
101 419
101 668
101 557
101 482

Неожиданно, но факт: официально для Samsung 950 Pro объемом 512 Гбайт указывается до 12 000 IOPS на операциях случайного чтения в один поток и до 43 000 IOPS – на записи. Фактически при разгоне процессора мы можем получить от этого накопителя больше 14 000 и 51 000 IOPS соответственно. Иначе говоря, инженеры компании в спецификациях указали заниженные результаты, тогда как от устройства можно добиться много большего. И уже применительно к теме нашего разговора отметим два момента.

Момент первый. На операциях записи нам будет достаточно практически любой мало-мальски приличной тактовой частоты - показатель в 100 000 IOPS является пределом для однопоточной записи. Что интересно, с глубиной очереди запросов равной двум, двухъядерный процессор даже выиграет в быстродействии.

Момент второй. С операциями чтения все столь же трагично, сколь прекрасно с чтением. Разогнанный до 4.7 ГГц четырехъядерный Skylake-S – это совсем не игрушка с точки зрения производительности. Но даже его не хватает, чтобы полностью раскрыть весь потенциал Samsung 950 Pro на операциях мелкоблочного чтения – прирост показателей IOPS идет буквально «до последнего».

Данный тест еще раз продемонстрировал нам то, что мы наглядно увидели в двух предыдущих («Есть ли разница – 2016» и «Страсти по NVMe») материалах по SSD: развитие оных достигло таких пределов, что гнаться за самыми скоростными моделями просто нет смысла. Фактически вся сфера применения подобных высокоскоростных SSD PCI-e – демонстрировать гигабайты в секунду на простом копировании файлов туда-сюда, где нет нагрузки на ЦП. В реальной работе с данными мощности процессора не хватает на обслуживание даже самих дисковых операций, не то, что на обработку полученного от накопителя.

Подчеркнем: речь о PCI-e. Для SATA 6 Гбит/с проблема стоит менее остро: 198 тысяч IOPS 4k – это примерно 800 Мбайт/с, что в полтора раза превосходит физические возможности интерфейса SATA 6 Гбит/с. Поэтому в тестах SATA SSD любого класса нам будет достаточно двухъядерного Skylake-S, работающего на частоте ~3.5 ГГц. Причем как в полностью синтетических тестах, так и в тестах, имитирующих реальную пользовательскую нагрузку (вроде PCMark). Последние создаются так, чтобы их процессорозависимость была минимальной (все обращения к накопителю – по заранее просчитанному и неизменному сценарию).

Заданным условиям неплохо соответствует нашедшийся в запасах процессор Intel Core i3-6100 – двухъядерный Skylake-S с активной технологией Hyper Threading, работающий на частоте 3700 МГц. У него лишь один недостаток: разгон возможен только посредством изменения базовой частоты, что, согласно ограничениям компании Intel, приводит к отключению встроенного графического ядра.





Страница 1 из 10
Оценитe материал

Комментарии 36 Правила

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают