Разгон Matisse или в поисках предела. Обзор архитектуры Zen 2

Разгон ОЗУ

Ввиду того, что на данный момент присутствуют некоторые сложности с UEFI (баги и спорные моменты, которые в ближайшее время будут откалиброваны) я затрону только ключевой вопрос, который так волнует пользователей, а именно масштабируемость производительности при разгоне оперативной памяти.

Разгон Matisse или в поисках предела

Интересной информацией, которая не попала в Сеть, является измененный рабочий procODT (на любой материнской плате), теперь оптимальный диапазон находится в переделах 28–36,9 Ом для одноранговой памяти и 48-60 Ом для двуранговой. Рабочие RTT остались теми же что и были.

Также Matisse представил новую настройку напряжения, которая называется CLDO_VDDG. VDDG — это напряжение IF, как могли догадаться, отвечает за целостность данных IF. Существует для стабилизации высоких частот FCLK. CLDO в названии означает, что в напряжении используется стабилизатор выпадения (LDO = низкий уровень выпадения).

Так как CLDO_VDDG и CLDO_VDDP регулируются из плоскости VDDCR_SoC, существует правило установки VDDG. Напряжение SoC должно быть выше, чем запрошенный VDDG. По умолчанию оно составляет 0,950 В, однако некоторые материнские платы могут превышать уровень по умолчанию даже при стандартных настройках.

Моя рекомендация использовать ручное VDDG со значением 0,95 В (хватает для разгона FCLK до 1800 МГц включительно) или же держать интервал 0,05 В между ним и SoC, в противном случае система не будет использовать пользовательские настройки VDDG. Безопасный предел для VDDG до 1,1 В включительно.

CLDO_VDDP советую вообще не трогать, 0,9 вольт замечательное число, которое позволяет тренировать память на частотах 2133–4333 МГц. «Memory Holes» на моих экземплярах обнаружено не было.

Сниженного аппетита к напряжению DRAM я не заметил. Тайминги зажимаются аналогично, без каких-либо сюрпризов, потому вы можете использовать с легкостью конфигурации с прошлого Ryzen.

Насчет режимов 2:1 и 1:1. Переключение между ними автоматическое, после того как память достигла 3600 МГц идет автоматический переход в режим 2:1, но так как присутствует запас по частоте UCLK/FCLK 1900 МГц режим 1:1 можно вернуть, выставив в FCLK значение, равное половине от эффективной частоты оперативной памяти. Из особенностей это колдбут при переходе в режим 2:1 или 1:1, он будет всегда, так как режимы задействуют либо один тактовый генератор процессора, либо тактовый генератор процессора и материнской платы сразу (не у всех материнских плат стоит внешний тактовый генератор BCLK, не стоит скидывать со счетов и это). Второй нюанс — POST-код на материнской плате «07» означает, что лимит FCLK достигнут по той или иной причине и зачастую наваливание напряжения на VDDG просто не даст никакого результата.

И самое главное, не используйте для регулировки какого либо параметра Ryzen Master, он еще крайне сырой. Я использовал его только для мониторинга, хотя он не всегда говорил правду.

В качестве доказательств я продемонстрирую тест стабильности пресетов, которые использовались в этом гайде-обзоре.

Тестовые конфигурации

Тестовый стенд №1:

  • процессор: AMD Ryzen 7 2700X;
  • система охлаждения: NZXT Kraken X62;
  • материнская плата: MSI X470 GAMING M7 AC (V1.94 , AGESA 1.0.0.1);
  • память №1: G.Skill Sniper X 3400C16 (2x8GB, Samsung B-die 20 nm, Single Rank);
  • память №2: G.Skill Trident Z 3000C14  (2x16GB, Samsung B-die 20 nm, Dual Rank);
  • видеокарта: MSI GeForce GTX 2080 Ti GAMING X TRIO;
  • накопитель: Samsung 970 Pro 512GB;
  • блок питания: Corsair HX750i;
  • операционная система: Windows 10 64-bit 1903;
  • драйвер чипсета: 1.07.0725;
  • драйвер видеокарты: NVIDIA GeForce 431.36 WHQL.

Тестовый стенд №2:

  • процессор: AMD Ryzen 7 3700X;
  • система охлаждения: NZXT Kraken X62;
  • материнская плата: ROG Crosshair VIII Hero (WI-FI) (0702,  AGESA 1.0.0.3AB);
  • память №1: G.Skill Trident Z Royal 3600C16 (2x8GB, Samsung B-die 20 nm, Single Rank);
  • память №2: G.Skill Trident Z 3000C14 (2x16GB, Samsung B-die 20 nm, Dual Rank);
  • видеокарта: MSI GeForce GTX 2080 Ti GAMING X TRIO;
  • накопитель: Samsung 970 Pro 512GB;
  • блок питания: Corsair HX750i;
  • операционная система: Windows 10 64-bit 1903;
  • драйвер чипсета: 1.07.0725;
  • драйвер видеокарты: NVIDIA GeForce 431.36 WHQL.

Результаты тестирования

AIDA64

Разгон Matisse или в поисках предела

Разгон Matisse или в поисках предела

Разгон Matisse или в поисках предела

Разгон Matisse или в поисках предела

Результаты довольно предсказуемые, запись у одночиплетного процессора просела, тем не менее, в играх проблем этот «недостаток» не вызвал. Те, кто только что к нам присоединились, советую прочесть теоретическую часть, в которой я объяснил, почему это не является какой либо потерей.

Латентность новое поколение продемонстрировало немного худшую, нежели предшественники. Причина проста — контроллер памяти теперь соединен через шину и не находится вблизи комплекса ядер. Насколько критично? Смотрим дальше.

MEMbench

Разгон Matisse или в поисках предела

Разгон Matisse или в поисках предела

Новобранец на поле боя бенчмарков. Ближе к концу месяца новая версия будет доступна для всех пользователей. Первый тест — это замер латентности. Основная идея заключается в доступе к памяти, который процессор не может предугадать (если вкратце, то чтение элементов массива относительно смещения).

Второй тест — выполнение определенных задач с блоками на скорость. Может предсказать разницу по больнице в играх, поэтому я на него делаю достаточно большую ставку.

Sisoftware Sandra

Разгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках предела
Разгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках предела
Разгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках предела
Разгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках пределаРазгон Matisse или в поисках предела

Данный пакет мне нравится тем, что, во-первых, он уже достаточно давно на рынке, во-вторых — ребята следят за обновлениями и, в-третьих, — огромное число тестов, альтернатив которым, по сути, нет.

К примеру, тот же тест эффективности взаимодействия ядер и комплексов между собой. Multi-Core Effiency отлично продемонстрировал изменения, которые были сделаны в архитектуре. Межъядерные задержки в самом лучшем сценарии (U0-U10) имеют разницу в 34% при использовании разгона ОЗУ. Рост пропускной способности между ядрами достиг величины в 96 гигабайт в секунду (!) против 64 Гбайт/с в прошлом поколении. Не могу не упомянуть рост в 2,7 раза математической производительности в пересчете на ватт, что, несомненно, понравится любителям работать с графическими пакетами, которые требуют огромных вычислительных ресурсов.

В качестве примеров я сделал для вас большое сравнительное тестирование в разных задачах, начиная от математического моделирования и заканчивая обработкой фотографий.

y_cruncher

Разгон Matisse или в поисках предела

y-cruncher — это программа, которая может вычислять Pi и другие константы в триллионы цифр. Это первый в своем роде многопоточный и прекрасно масштабируемый тест для многоядерных систем. С момента своего запуска в 2009 году он стал одним из главных приложений для бенчмаркинга и стресс-тестирования для оверклокеров и энтузиастов.

Еще одной интересной особенностью этого теста является реакция на разгон Infinity Fabric (FCLK). Из-за снижения задержек между ядрами и комплексами растет многоядерная утилизация, от чего меняется и время вычисления числа Pi (ну или любой другой константы). Удивительно, но для процессоров поколения Matisse я получил на 33% меньшее время вычисления константы, используя разгон ОЗУ. В случае прошлого поколения максимальная разница составляла всего лишь 15%. Подводя итог данного теста, хочу отметить, что разгон ОЗУ может очень сильно повлиять на скорость выполнения оптимизированного многопоточного кода.

AIDA64 Encryption

Разгон Matisse или в поисках предела

Данные тесты это скорость процессора при выполнении шифрования по алгоритмам SHA3 и AES. Существенной разницы разгон оперативной памяти не сделал, а если быть точнее ее вовсе не оказалось, даже между разными поколениями.

CB15 / CB20

Разгон Matisse или в поисках предела

Разгон Matisse или в поисках предела

Рендеринг является наверно самой популярной рабочей нагрузкой процессора в наши дни, которую я не имел права обойти стороной. Данные тестовые пакеты являются одними из лучших индикаторов производительности в однопоточной и многопоточной нагрузке. Пакеты для рендернинга отлично откликаются на изменение частоты и IPC.

В итоге поколение Zen 2 обошел своего предшественника на величину до 20% в многопоточной нагрузке и до 15% в однопоточной, что собственно подтверждает заявление компании AMD относительно возросшего IPC. Про частоту в данном случае я не говорю, ибо Ryzen 7 3700Х отказался буститься на одно ядро свыше 4367 МГц даже при отключении лимитов PBO/андервольте или переходе в режим PB2. То есть, тесты в однопотоке можно считать равными. Разгон ОЗУ на результаты почти не повлиял.

Blender

Разгон Matisse или в поисках предела

Еще один рендер-пакет. Он продемонстрировал куда большую разницу, нежели его предыдущие сородичи. Максимальный отрыв Zen 2 от Zen+ составил 36%. Разгон ОЗУ на результаты не повлиял.

X265

Разгон Matisse или в поисках предела

x265 — это открытая реализация нового стандарта кодирования видео H.265 (или по-другому High Efficiency Video Coding (HEVC)). Стандарт H.265 является логическим продолжением H.264 и характеризуется более эффективными алгоритмами сжатия. Разница достигает 46% между Ryzen 7 2700Х и Ryzen 7 3700Х в стоке. Разгон ОЗУ повилял слабо в случае Ryzen 7 3700Х, лишь несколько дополнительных процентов производительности.

Capture One

Разгон Matisse или в поисках предела

Популярный пакет обработки фотографий формата RAW. Полученный результат это время преобразования 30 фотографий формата RAW в формат JPG. Прелесть этой программы заключается в многопоточной поддержке и возможности ускорить обработку с помощью видеокарты. В данном тестировании ускорение с помощью видеокарты было отключено.

Почти 25% составил отрыв между Ryzen 7 2700Х и Ryzen 7 3700Х, также было замечено существенное влияние разгона ОЗУ на производительность.

Luxmark

Разгон Matisse или в поисках предела

LuxMark является эталонным тестом, разработанным с использованием движка LuxRender, который предлагает несколько различных сцен и API.

В своем тесте я использовал простую сцену «Ball» в режиме C++. Эта сцена начинается с грубого рендеринга и медленно улучшает качество в течение двух минут, давая конечный результат, который, по сути, является «килолучами в секунду».

Разгон ОЗУ для Ryzen 7 3700Х позволил получить дополнительных 10% производительности. Разница между дефолтными состояниями процессора составила около 20%.

Также была попытка протестировать эту цену в режиме OpenCL CPU, но, к сожалению, поддержка OpenCL процессорами AMD была свернута еще в августе прошлого года с пакетом драйверов 18.8.1, хотя в заметках к выпуску об этом не было ни слова. Конечно, нативные приложения CPU работают лучше, чем приложения OpenCL на процессоре, но AMD была пионером в этом направлении и серьезным конкурентом для Intel. Сегодня же поддерживает OpenCL на своих CPU-платформах только Intel.

3DMark Time Spy (CPU)

Разгон Matisse или в поисках предела

Разгон Matisse или в поисках предела

Каждый игровой тест состоит из одной или двух тяжелых сцен для графического процессора, а также физического теста для процессора. Основными о тестами в порядке сложности построения сцен являются Ice Storm, Cloud Gate, Sky Diver, Fire Strike и Time Spy. Я использовал Time Spy, так как он имеет поддержку AVX-512. Предупреждаю сразу, что результаты не являются результатом комби-теста, так как мы сегодня рассматривает процессоры.

13% разницы между стоковыми состояниями процессоров и весомый бонус производительности при разгоне ОЗУ для обеих поколений в размере 20%, что есть очень неплохо и говорит об нужде процессоров в высокоскоростной шины Infinity Fabric.

Игры

Разгон Matisse или в поисках пределаРазгон Matisse или в поисках предела
Разгон Matisse или в поисках пределаРазгон Matisse или в поисках предела
Разгон Matisse или в поисках пределаРазгон Matisse или в поисках предела
Разгон Matisse или в поисках пределаРазгон Matisse или в поисках предела
Разгон Matisse или в поисках пределаРазгон Matisse или в поисках предела

Что касается игр, то почти в любом сценарии был замечен серьезный рост 0,1% fps. Это, безусловно, крутая новость для киберспортсменов, когда ничто и никто не должны влиять на скилл. Средняя частота кадров «по больнице» возросла на 20%, а средняя загрузка видеоядра в субмаксимально низких разрешениях (720p) составила около 70–85%, что говорит нам о том что пора на рынок выпустить что-то посерьезней, чем GeForce RTX 2080 Ti. Я напомню, что это был лишь Ryzen 7 3700Х. С мощью темной красной стороны в лице Ryzen 7 3900Х я познакомлю вас спустя некоторое время.

Выводы

Начнем наверно с минусов. Первое, что морально зацепило многих фанатов, это доступность процессоров в первый день старта продаж. Причина этого явления — приоритет складских запасов для огромных торговых площадок плюс новый уровень защиты от утечек, который повлиял на логистику в целом (в том числе и на мой обзор). Второе, что меня без сомнения впечатлило, это лень производителей материнских плат, тестирование опытных образцов началось на довольно позднем этапе. К примеру, компания MSI до сих пор не родила какой либо финальный UEFI для своего прошлогоднего топа в лице M7 Gaming X (сегодня у нас 29.07.2019), а то что лежит на сайте я просто оставлю без комментариев. Поэтому я был вынужден пересесть сразу на X570 в лице ASUS Crosshair VIII Hero (WI-FI).

Также не могу не отметить странный буст в обзорах первого дня. В большинстве случаев обзорщики не стали следовать рекомендациям AMD и использовать Windows 1903 c чипсетным драйвером 1.07. Тестировали, на чем душе было угодно. Кто-то просто тестировал на не сертифицированной прошивке. В итоге некоторые ресурсы ретест делали даже 3 раза. К счастью, в реальности проблемы не существует как таковой, а неудачные экземпляры с посредственным бустом обусловлены бинингом или некорректной маркировкой успешных ядер. На моем экземпляре Ryzen 7 3700Х в однопотоке не получилось преодолеть 4367 МГц. Призванный на помощь режим андервольта оказался странным, PB2 или PBO адекватно на него не реагировали, при снижении напряжения помимо освобождения запаса по пакету PPT и температуре не позволяли увеличить частоту ядер в нагрузке, иногда даже был получен отрицательный частотный эффект. Возможно, Clock Stretcher имеет довольно агрессивные настройки, дабы максимально сделать системы с новыми процессорами Zen 2 стрессоустойчивыми. Представленный режим PB2 как «просто накинь +200 МГц к стандартному бусту» оказался неработоспособным на Ryzen 7 3700Х, но превосходно себя проявил на процессоре Ryzen 5 3600, который получил стабильные 4,4 ГГц в нагрузках на несколько ядер.

Еще одним забавным моментом было переход процессорных ядер во время бездействия в режим CC6 (глубокий сон) с VID в 1,47 вольта, что не позволяло процессору в режиме простоя экономить электроэнергию и иметь холодную крышку. К счастью решение нашлось довольно быстро, банальным переключением плана питания в сбалансированный режим с минимальным состоянием процессора в 85%. В ближайшие дни нас ожидает фикс в виде новых чипсетных драйверов.

Не могу не отметить Ryzen Master, утилиту, которая способна была отправить в бутлуп или повесить систему при изменении некоторых настроек, связанных с SMT, выборочным отключением ядер или изменение FCLK. К счастью данные утилиты любой фирмы имеют схожий ряд проблем, потому старый добрый разгон через прошивку никто не отменяет. На благо он, к моему удивлению, не имел багов или проблем. Потому я могу рекомендовать Ryzen Master на данный момент только в качестве информационной утилиты.

И да, не забывайте чистить руками реестр от старых версий, дабы не было конфликтов ПО.

Последним странным моментом для меня оказался вентилятор чипсета на X570, который непонятно по какой причине находится ровно под видеокартой (в случае ASUS Crosshair VIII Hero) и все тепло с видеокарты, разумеется, попадет в него. То ли это толчок энтузиастам, чтобы пересели на видеокарты с водой, то ли для того чтобы продвинуть корпуса с вертикальным воздушным потоком, в общем это осталось вне моего понимания. Малютка PCH во всех тестах держался на грани 75–80 градусов, по мнению HWInfo, потому я был вынужден открыть корпус и навесить 140-ку, которая обдувала память и захватывала скользящим потоком усилительную пластину видеокарты, тем самым формируя поток прохладного воздуха для PCH. В таком режиме температура хаба не переваливали отметку в 60 градусов. Из глобального, наверно, все.

Хотел бы уделить еще пару строк обновленному контроллеру памяти. Более гибкое дифференцированное управление питанием SOC и VDDG, новый режим 2:1 для профессиональных оверклокеров, хотя и сейчас я смысла в нем не вижу, ибо режим 1:1 с разгоном ОЗУ до 3533–3733 МГц обойдет любые 4200–4600 МГц. Предел для режима 1:1 является программным, присутствует ограничение в 1900 МГц по FCLK/UCLK и 3800 МГц по частоте ОЗУ соответственно. Обойти предел с помощью BCLK, к сожалению, невозможно. Существенно снизился нижний рабочий порог procODT, который говорит об прекрасном разгоном потенциале, что собственно получилось подтвердить на практике. Новички и энтузиасты могут ликовать, контроллер памяти, получив независимость, стал менее капризным, а тренинг памяти стал более предсказуем. Систему настроить стало гораздо проще даже на платах с чипсетом 300 серии. Это безусловно подарок для пользователей всех сегментов АМ4-плат.

Удивительно, но за последние два года компания AMD смогла сделать целых два «тик-так». Во первых это был Zen, новая архитектура (которая дала 52% рост IPC относительно «фикусов») и новый 14-нм техпроцесс, а теперь опять, по сути, новая архитектура и новый техпроцесс. Разница IPC между Zen и Zen 2 составляет 29,4% в вычислениях как на целых числах, так и на числах с плавающей запятой. Частота базового буста выросла с 4,35 ГГц до 4,6 ГГц, а число ядер увеличилось вдвое благодаря многочиплетному дизайну. Новая ступень энергоэффективности и производительности на ватт не оставят равнодушным ни геймеров, ни любителей организовать дома маленький сервер с огромными возможностями в рабочих приложениях. Не могу не отметить колоссальную работу, которую компания AMD проделала по хардварной оптимизации процессоров и материнских плат для оперативной памяти, благодаря которой мы можем заполучить дополнительные десятки процентов fps в сфере гейминга. Платы на чипсетах X570 являются просто роллс-ройсами в своем классе: огромное кол-во фаз, которые крайне сложно прогреть, разгон ОЗУ и новый стандарт PCI-E Gen 4.0 , который в ближайшие год позволит поднять производительность всей отрасли на новую ступень.

На сегодня все, а в ближайшее время я поведаю о Ryzen 9 3900Х, ряде плат на чипсете X570 и андервольте. Также у меня есть желание расширить количество игр и тестов. Оставайтесь на связи!

Находим избытки, применяем с умом!