Ускоряем жесткий диск. OCZ Synapse Cache как альтернатива Intel Smart Response

Методика тестирования

Тестирование проводилось на тестовом стенде следующей конфигурации:
  • материнская плата: Sapphire Pure Platinum Z68 (Intel Z68 Express);
  • процессор: Intel Core i3-2100;
  • оперативная память: Kingston KVR1333D3N9 (2x2 ГБ, DDR3-1333);
  • видеокарта: Palit GeForce GTX 480;
  • накопители: WD VelociRaptor WD1500HLHX x2, OCZ Vertex 3 Max IOPS 120 GB, OCZ Synapse Cache 120 GB;
  • монитор: LG W3000H;
  • блок питания: Huntkey X7-900 (900 Вт);
  • операционная система: Microsoft Windows 7 Ultimate x64, Intel RST Driver 10.8.0.1003.
Использовался следующий набор тестовых приложений:
  • CrystalDiskMark 3.0.1 x64 — синтетическая оценка линейной скорости накопителя, скоростей в многопоточном режиме с глубиной очереди 64 запроса, при случайном доступе блоками по 4 КБ, а также времени доступа;
  • AS SSD Benchmark 1.6.4237.30508 — синтетическая оценка линейной скорости накопителя, скоростей в многопоточном режиме с глубиной очереди 64 запроса, при случайном доступе блоками по 4 КБ, а также времени доступа;
  • HD Tune 5.0 — снятие диаграммы линейного чтения с накопителей;
  • Futuremark PCMark Vantage HDD Suite — набор тестовых трасс, эмулирующих работу пользователя в наиболее популярных типах приложений;
  • Futuremark PCMark 7 System Storage — аналогично PCMark Vantage, представляет собой набор тестовых трасс, ориентированный на оценку системного накопителя ПК;
  • Retouch Artists Photoshop Benchmark — автоматизированный набор фильтров для Adobe Photoshop, предназначенный для оценки быстродействия ПК;
  • DriverHeaven Photoshop Benchmark — аналогичный предыдущему набор фильтров для Adobe Photoshop;
  • PPBM5 — бенчмарк для Adobe Premiere CS5, представляющий собой проект из трех различных видеорендеров, один из которых критичен к производительности жесткого диска.
Также оценивались:
  • время запуска ОС с помощью утилиты BootRacer (фиксирует время между стартом ядра ОС и полной загрузкой всех служб и программ в автозагрузке);
  • время запуска ОС с помещенными в автозагрузку Microsoft Word, Excel и PowerPoint 2010, открывающими текстовый документ размером 4,2 МБ (4208 страниц), таблицу размером 50,6 МБ (65187 строк) и презентацию размером 72 МБ (69 слайдов), соответственно;
  • время запуска тестовой сцены Crysis 2 в режиме DirectX 11 с High Resolution Texture Pack (от нажатия Start в Adrenaline Crysis 2 Benchmark Tool до старта сцены);
  • время запуска тестовых сцен S.T.A.L.K.E.R. Call of Pripyat Benchmark (сумма времен от появления заставки игры до начала тестовой сцены).
Все тесты проводились 5 раз для того, чтобы дать возможность всем кэширующим алгоритмом добиться максимальной производительности.


CrystalDiskMark


Тестирование WD VelociRaptor WD1500HLHX
WD VelociRaptor WD1500HLHX

Тестирование 2x WD VelociRaptor RAID-0
2x WD VelociRaptor RAID-0

Тестирование OCZ Vertex 3 Max IOPS
OCZ Vertex 3 Max IOPS

Тестирование WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Enhanced)
WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Enhanced)

Тестирование WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Maximized)
WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Maximized)

Тестирование WD VelociRaptor + OCZ Synapse Cache
WD VelociRaptor + OCZ Synapse Cache

Первый синтетический тест сразу, ожидаемо, отдает предпочтение SSD-накопителям, и это неудивительно: устройства на базе мощнейших контроллеров SandForce второго поколения могут похвастать не только минимальным временем доступа (что и является основным козырем твердотельных накопителей), но и огромными показателями линейных скоростей. В результате OCZ Vertex 3 с огромным отрывом опережает WD VelociRaptor и RAID-0 на его базе. Однако есть и интересные результаты: во-первых, заметно, что Intel Smart Response имеет довольно значительные накладные расходы. В частности, в режиме Enhanced мы наблюдаем великолепный прирост производительности в режиме чтения, однако показатели при записи оказываются даже ниже относительно одиночного жесткого диска при линейном доступе. Еще больше сказывается переход в режим Maximized: система теряет еще 40 МБ/с при чтении, однако скорость записи, естественно, несравнимо вырастает, особенно на мелких блоках. Правда, в линейном доступе Smart Response не может сравниться даже с RAID-0 из «рапторов», не то что с одиночным OCZ Vertex 3. Однако тут нужно понимать, что в данном случае запись происходит не на сам SSD, а «сквозь» него на жесткий диск, и наблюдаемый прирост — это усредненное значение, полученное за счет резких всплесков скорости при записи на твердотельный накопитель.

Второе интересное наблюдение: система с OCZ Synapse Cache в синтетическом тесте значительно уступает обоим режимам Intel SRT. По линейным скоростям она сравнима с RAID-0, а при работе с мелкими блоками уступает Intel SRT вплоть до 50%. Сложно сказать, чем объясняются такие результаты: с одной стороны, в синтетических тестах подобные алгоритмы кэширования и должны вмешиваться как можно меньше, чтобы не изнашивать ячейки NAND, с другой, вряд ли NVELO удалось разработать более «умный» алгоритм, чем Intel. Вполне вероятно, просто сказываются накладные расходы на обработку шквала запросов, которые генерируют CrystalDiskMark и аналогичные утилиты, и у Dataplex они оказываются выше, чем у Intel Smart Response.


AS SSD Benchmark

Тестирование WD VelociRaptor WD1500HLHX

Тестирование WD VelociRaptor WD1500HLHX
WD VelociRaptor WD1500HLHX

Тестирование 2x WD VelociRaptor RAID-0

Тестирование 2x WD VelociRaptor RAID-0
2x WD VelociRaptor RAID-0

Тестирование OCZ Vertex 3 Max IOPS

Тестирование OCZ Vertex 3 Max IOPS

OCZ Vertex 3 Max IOPS

Тестирование WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Enhanced)

Тестирование WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Enhanced)
WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Enhanced)

Тестирование WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Maximized)

Тестирование WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Maximized)
WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Maximized)

Тестирование WD VelociRaptor + OCZ Synapse Cache

Тестирование WD VelociRaptor + OCZ Synapse Cache
WD VelociRaptor + OCZ Synapse Cache

Несмотря на однотипность утилит CrystalDiskMark и AS SSD Benchmark, они основаны на разных алгоритмах тестирования, в частности, последняя оценивает быстродействие SSD намного более скрупулёзно, и суммарный объем записываемых на них данных доходит до 3 ГБ за один проход. В результате мы получаем довольно интересную картину.

Обратите внимание на занимательные показатели прироста производительности при переходе от одного HDD к RAID-0. В режиме линейного чтения и записи он, как и ожидается, составляет около 80—90%. Однако при нагрузке массива мелкими запросами в многопоточном режиме он начинает работать более чем вдвое быстрее одиночного диска! Объяснение этому простое: логика драйвера Intel Rapid Storage отлично справляется с кэшированием, а отлаженные прошивки VelociRaptor успешно переупорядочивают очередь запросов. Эти HDD разрабатываются именно для работы в таких условиях, и неудивительно, что их потенциал лучше раскрывается именно в RAID, а не в одиночном режиме.

Отметим, что AS SSD, в отличие от CrystalDiskMark, не обнаруживает значительного падения скорости чтения в режиме Intel SRT Maximized относительно режима Enhanced, хотя оба они работают примерно на 20% медленнее самостоятельного SSD. Также интересно, что в режиме Enhanced поток запросов AS SSD на чтение не полностью переносится на кэширующий твердотельный диск: в паттерне 4K 64Thrd (доступ блоками по 4 КБ со случайной адресацией в 64 одновременных потока) в этом режиме массив демонстрирует 18200 IOPS против 45500 IOPS в режиме Maximized.

Что касается OCZ Synapse Cache, то с ним показатели сохраняются — он почти вдвое медленнее при чтении, чем Intel SRT, однако с записью (в особенности многопоточной) справляется намного лучше. Вероятнее всего, тут снова сказываются особенности работы Dataplex: с одной стороны, этот алгоритм менее активно кэширует запросы на чтение, с другой — лучше справляется с записью.


HD Tune

Тестирование WD VelociRaptor WD1500HLHX
WD VelociRaptor WD1500HLHX

Тестирование 2x WD VelociRaptor RAID-0
2x WD VelociRaptor RAID-0

Тестирование OCZ Vertex 3 Max IOPS
OCZ Vertex 3 Max IOPS

Тестирование WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Enhanced)
WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Enhanced)

Тестирование WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Maximized)
WD VelociRaptor + OCZ Vertex 3 Max IOPS (Intel SRT Maximized)

Тестирование WD VelociRaptor + OCZ Synapse Cache
WD VelociRaptor + OCZ Synapse Cache

Наконец, изучение графиков чтения всех шести вариантов подсистем хранения данных, рассматриваемых нами, дает примерное представление, почему предыдущие два теста вели себя так необычно. Как видно на графиках обоих режимов Intel SRT, при обращении к HDD на чтение в линейном режиме драйвер начинает что-то делать, вероятнее всего, активно кэшировать хранимые по выбираемым тестовым приложением адресам данные. В итоге мы наблюдаем заметный «провал» в скорости. Как только занятое пространство заканчивается (а в нашем случае резкий скачок на графике до нормального уровня как раз примерно приходится на границу занятой ОС и тестовым пакетом области) — все приходит в норму. Кроме того, график чтения системы с одиночным OCZ Vertex 3 также показывает, что этот SSD в фоновом режиме очень активно проводит служебные операции над занятой зоной.

График чтения системы с OCZ Synapse Cache вообще объяснению не поддается, судя по всему, характер обращений HD Tune просто непонятен Dataplex. Фактически при используемом HD Tune формате доступа к HDD (линейно блоками по 1 МБ) Dataplex даже снижает производительность относительно чистой скорости, обеспечиваемой жестким диском.