Знакомство с APU Trinity. Обзор и тестирование гибридного процессора AMD A10-5800K

Реалии рынка центральных процессоров таковы, что среди компаний, выпускающих х86-совместимые устройства, доминируют два крупных игрока: Intel и AMD. Некогда успешная VIA Technologies сегодня не предлагает конкурентоспособных решений, хотя, в её ассортименте есть весьма интересные энергоэффективные продукты для встраиваемых систем и мобильных устройств. Что касается лидеров рынка, то компания Intel занимает порядка 83% рынка, в то время как Advanced Micro Device вынуждена довольствоваться скромной долей в 16%. На фоне успехов силиконового гиганта из Санта-Клары, AMD очень непросто конкурировать и удерживать технологическое превосходство. Тем не менее, остается рыночная ниша, в которой чипмейкер из Саннивейла чувствует себя очень уверенно. Речь идет о гибридных процессорах, или APU (Accelerated Processing Units), которые объединяют на одном полупроводниковом кристалле графическое и вычислительные ядра. Вышедшие в начале 2011 года экономичные APU E-series, предназначенные для использования в составе мобильных и встраиваемых систем, позволили AMD закрепиться на этом перспективном рынке. А представленные полугодом позже APU A-series перового поколения, известные также как Llano, лишь усугубили успех. Эти гибридные процессоры наделены весьма мощным, как для интегрированного решения, графическим акселератором, который обеспечивает приемлемый уровень быстродействия в большинстве современных 3D-игр. В то же время, производительность вычислительной части APU Llano невысока, а энергопотребление оставляет желать лучшего, особенно, в сравнении с новейшими Intel Ivy Bridge. Понимая, что повышением тактовых частот и косметическими улучшениями дизайна не то что опередить, но даже догнать продукты конкурента уже не удастся, компания AMD приняла решение о внедрении в гибридные процессоры принципиально новой микроархитектуры Piledriver — улучшенной версии нашумевшей в прошлом году Bulldozer. И уже в октябре 2012 года на суд общественности были представлены обновленные APU A-Series, получившие кодовое имя Trinity. Помимо модернизации вычислительной части изменения коснулись и графического ускорителя, а сами гибридные процессоры получили новый разъем Socket FM2. Очень кстати, хотя и с некоторым опозданием, в тестовой лаборатории оказался AMD A10-5800K, который и позволит нам оценить быстродействие и разгонный потенциал новейших Trinity.


Особенности дизайна Trinity

Полупроводниковые кристаллы APU Trinity изготавливаются с соблюдением 32-нм норм литографического процесса, площадь ядра составляет 246 кв. мм, а общее число транзисторов насчитывает около 1300 млн. Ключевой особенностью гибридных процессоров AMD A-series второго поколения стал переход на микроархитектуру Piledriver, в то время как APU Llano использовали вычислительные ядра К10 Stars, ведущие свою родословную от первых Athlon 64. По своей сути Piledriver представляет собой улучшенную и доработанную микроархитектуру Bulldozer, впервые использованную в процессорах AMD FX. В своей максимальной конфигурации AMD A-series второго поколения могут содержать два вычислительных модуля Piledriver, графическое ядро Radeon HD 7000, контроллеры оперативной памяти и шины PCI Express 2.0, ряд вспомогательных блоков, а также встроенный северный мост, который обеспечивает связь между всеми компонентами гибридного процессора.

AMD APU Trinit

Каждый из вычислительных модулей Piledriver состоит из двух целочисленных блоков (ALU), которые снабжены собственными кэшами L1, одного устройства для выполнения операций с плавающей точкой (FPU), единственного декодера блока предвыборки инструкций и общего массива кэш-памяти второго уровня объемом 2 МБ. Такое строение позволят каждому из двух вычислительных модулей выполнять до четырех вычислительных потоков одновременно. Однако, скорость работы в приложениях, интенсивно использующих блоки FPU, может сильно снижаться вследствие совместного использования ресурсов двумя потоками вычислений.

AMD APU Trinit

От AMD FX гибридные процессоры второго поколения отличает отсутствие кэш-памяти третьего уровня. Тем не менее, производитель заявляет о некоторых нововведениях, улучшающих быстродействие Piledriver по сравнению с Bulldozer. Например, были улучшена работа блока предсказания переходов и планировщика заданий, а также увеличена скорость выполнения операции деления. Размер буфера L1 TLB увеличился вдвое, а эффективность работы кэш-памяти второго уровня была улучшена за счет ускоренной очистки от неиспользуемых при вычислениях данных и улучшенного механизма предвыборки. Появилась поддержка новых дополнительных инструкций, таких как FMA3 и F16C.

Отсутствие кэш-памяти третьего уровня предъявляет повышенные требования к эффективности северного моста и контроллера ОЗУ. Кроме того, графическое и процессорные ядра имеют совместный доступ к оперативной памяти, но характер и объемы данных при этом различны. Вычислительные модули генерируют гораздо меньше запросов, но эти запросы имеют высший приоритет и должны быть обработаны немедленно. Видеоядро же использует гораздо больше памяти для кадрового буфера, поэтому, для обеспечения доступа встроенной видеокарты к контроллерам ОЗУ существует выделенная 256-битная шина Radeon Memory Bus. Также, графическое ядро может общаться со встроенным северным мостом посредством шины FCL (Fusion Control Link), которая, используется для передачи служебной и управляющей информации.

AMD APU Trinit

Возможности APU A-series второго поколения по работе с ОЗУ обеспечивают два 64-битных контроллера, которые могут работать в двухканальном режиме. Поддерживаются модули оперативной памяти SDRAM DDR3 с тактовой частотой 1866 МГц, что обеспечивает теоретическую полосу пропускания до 29,8 ГБ/с. Максимальный объем ОЗУ ограничен на отметке в 64 Гбайт. Одним из существенных нововведений контроллера оперативной памяти стала поддержка динамического управления частотой и напряжением модулей ОЗУ в угоду лучшей энергоэффективности.

В сравнении с гибридными процессорами предыдущего поколения графическая составляющая Trinity была полностью переработана. Интегрированное видеоядро, известное под кодовым именем Devastator, получило потоковые процессоры VLIV4, которые широко используется в семействе дискретных акселераторов Southern Islands. Многие надеялись, что обновленные APU A-series получат потоковые процессоры с архитектурой Graphics Core Next (GCN), показывающей лучшие результаты в неграфических вычислениях — одном из основных идеологических принципов APU.

AMD APU Trinit

Тем не менее, архитектура VLIV4 обеспечивает поддержку API DirectX 11 и OpenCL, а также обладает лучшей в сравнении с VLIV5 эффективностью использования аппаратных ресурсов. Напомним, что неприятной особенностью дизайна VLIV5 являлся тот факт, что пятый ALU (T-unit) каждого из скалярных SIMD-процессоров, способный исполнять сложную инструкцию (Special Function), часто простаивал из-за отсутствия должной оптимизации со стороны программного кода видеоигр. Отказ от T-unit повысил показатели производительности на единицу площади полупроводникового кристалла, а также снизил энергопотребление графического ускорителя и дал возможность увеличить его таковые частоты. В итоге, в своей максимальной конфигурации графическое ядро Devastator может содержать шесть SIMD-движков, каждый из которых состоит из четырех текстурных блоков и 16 потоковых VLIV4-процессоров.

AMD APU Trinit

Таким образом, старшие модели APU A-series располагают 384 унифицированными шейдерными процессорами и 24 текстурными блоками. Кроме этого, в состав графического ядра Devastator входит блок аппаратного декодирования видеопотока (UVD3), а также узел Video Codec Engine (VCE), обеспечивающий ускорение кодирования видео в формате H264. Существует возможность объединения ресурсов встроенной и дискретной видеокарт класса Radeon HD 6570 в связки Dual Graphics, что существенно повышает быстродействие в современных 3D-играх. Остается добавить, что гибридные процессоры Trinity поддерживают фирменную технологию Eyefinity и обеспечивают вывод изображения одновременно на три монитора.

Что касается технологий энергосбережения, то за управление тактовой частотой и напряжением новейших APU A-series отвечает фирменная технология AMD Turbo Core 3.0. Её работа заключается в динамическом управлении быстродействием вычислительных и графического ядер в пределах ограниченного теплового пакета. Диспетчер P-state Manager анализирует текущее энергопотребление гибридного процессора и, в зависимости от характера нагрузки, задает режим работы отдельных функциональных блоков. Таким образом, при выполнении задачи, требующей максимум ресурсов центрального процессора, частота вычислительных модулей будет повышена относительно номинала, а при запуске 3D-приложения будет максимально ускорена работа встроенной видеокарты.


Платформа Socket FM2

По сравнению с AMD A-series предыдущей ревизии, дизайн APU Trinity претерпел кардинальные изменения. Поэтому, нет ничего удивительного, что обновленные гибридные процессоры получили новый разъем Socket FM2, который, увы, не совместим с решениями прошлого поколения. Новый конструктив очень похож на своего предшественника, различие заключается лишь в количестве контактов: у Socket FM2 их 904, в то время как на процессорах в исполнении Socket FM1 было 905 позолоченных ножек. Что касается электрических характеристик, то разъем поддерживает установку гибридных процессоров с TDP до 100 Вт включительно, а конструкция креплений позволяет использование систем охлаждения, предназначенных для Socket AM3+/FM1.

AMD Socket FM2

Для APU A-series второго поколения был разработан новый чипсет AMD A85X. Как вы помните, кристалл гибридного процессора содержит графическое и процессорные ядра, встроенный северный мост, контроллеры оперативной памяти DDR3 и шины PCI Express 2.0, а также цифровые интерфейсы для вывода изображения и UMI (Unified Media Interface) для связи с чипсетом. Поэтому, системная логике, имеющей одночиповую компоновку, достается роль «южного моста», который отвечает за работу дисковой подсистемы, периферийных устройств и плат расширения.

AMD Socket FM2

Чипсет AMD A85X поддерживает подключение до восьми устройств SATA 6 Гбит/с с возможностью организации RAID 0, 1, 5 и 10, обеспечивает работу четырех портов USB 3.0 и 10 каналов USB 2.0. Для подключения плат расширения и дополнительных контроллеров системная логика предлагает четыре линии PCI Express 2.0 и несколько слотов PCI. Микросхема FCH (Fusion Communication Hub) изготавливается с соблюдением норм 65-нм литографического тех.процесса в корпусе FC-BGA 605, её тепловыделение не превышает 4,7 Вт, что позволяет использовать для её охлаждения компактные пассивные радиаторы.

AMD Socket FM2

Что касается отличий системной логики AMD A85X от чипсета AMD A75 — флагманского решении для платформы Socket FM1, то они минимальны и заключаются в официальной поддержке конфигураций AMD CrossFireX, добавлении двух каналов SATA 6 Гбит/с, а также возможности объединения накопителей в массивы RAID 5. Более того, чипсеты, предназначенные для AMD A-series первого поколения, могут с успехом использоваться для построения материнских плат Socket FM2. Для персональных компьютеров начального уровня рекомендуется системная логика AMD A55, лишенная поддержки SATA 6 Гбит/с и USB 3.0, материнские платы среднего класса предполагается оснащать чипсетом AMD A75, а для самых производительных и функциональных систем позиционируется новейший AMD A85X.

Модельный ряд AMD A-series в исполнении Socket FM2 содержит разнообразные модификации, которые отличаются количеством вычислительных модулей, конфигурацией графического адаптера, а также тактовой частотой функциональных блоков и расчетным тепловыделением. Таким образом, на основе единственного полупроводникового кристалла создана целая продуктовая линейка, включающая и доступные модели начального уровня, и производительные решения для игровых системных блоков. Заметим, что кроме APU для Socket FM2 будут выпущены процессоры Athlon с отключенным графическим ядром. Актуальный модельный ряд AMD для платформы Socket FM2 имеет следующий вид:

Процессор A10-5800K A10-5700 A8-5600K A8-5500 A6-5400K A4-5300 Athlon X4 750K Athlon X4 740 Athlon X2 340
Разъем FM2 FM2 FM2 FM2 FM2 FM2 FM2 FM2 FM2
Техпроцесс, нм 32 32 32 32 32 32 32 32 32
Число ядер 4 4 4 4 2 2 4 4 2
Номинальная частота, МГц 3800 3400 3600 3200 3600 3400 3400 3200 3200
Частота Turbo Core, МГц 4200 4000 3900 3700 3800 3600 4000 3700 3600
L2-кеш, Мбайт 4 4 4 4 1 1 4 4 1
Графическое ядро Radeon HD 7660D Radeon HD 7660D Radeon HD 7560D Radeon HD 7560D Radeon HD 7540D Radeon HD 7480D
Число унифицированных шейдерных процессоров 384 384 256 256 192 128
Частота графического ядра, МГц 800 760 760 760 760 723
Поддерживаемый тип памяти DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1600 DDR3-1866 DDR3-1866 DDR3-1600
TDP, Вт 100 65 100 65 65 65 100 65 65

Разнообразие модификаций позволят каждому пользователю выбрать именно тот продукт, который больше всего отвечает поставленным задачам. Экономных пользователей заинтересуют AMD А4 и младшие Athlon, а любители разгона смогут обратить внимание на модели c литерою «К» в названии модели, оснащенные свободным коэффициентом умножения. Вместе с широким ассортиментом системных плат для платформы Socket FM2 новейшие процессоры AMD представляются неплохим вариантом для построения недорогих игровых и мультимедийных системных блоков.