Идея объединить в одном кристалле все основные узлы персонального компьютера возникла уже давно. Причин для этого две: увеличение быстродействия и снижение стоимости производства. Вначале математический сопроцессор был объединен с центральным процессором, затем к ним на кристалл перебралась и кэш-память, что привело к значительному увеличению быстродействия. Затем появились наборы системной логики со встроенным видеоядром, которое с трудом могло конкурировать даже с младшими дискретными адаптерами, но позволяло опять же немного сэкономить. Следующий шаг — размещение контроллера оперативной памяти на кристалле центрального процессора, что самым положительным образом сказалось на производительности. Логическим продолжением стал перенос всех функций северного моста поближе к вычислительным блокам. Южный мост все еще оставался тем, чем и был задуман с самого начала, а именно — связующим звеном между вычислительной подсистемой и многочисленной периферией. До победного конца оставалось «всего ничего» — объединить в одном кристалле графический адаптер, вычислительные ядра, контроллер памяти и северный мост. На первый взгляд никаких выгод, кроме экономических, нет. Однако это не так, и многие аналитики склоняются к тому, что будущее компьютерной индустрии за так называемыми гетерогенными вычислительными устройствами, которые объединяют в себе блоки последовательной и параллельной обработки данных. Давно известно, что производительность современных графических ядер в специфических задачах на несколько порядков выше, чем таковая для традиционных, даже многоядерных, центральных процессоров. При наличии соответствующего ПО видеокарты отлично справляются с шифрованием данных, обработкой мультимедиа и сложными математическими расчетами. Таким образом, гетерогенный процессор превращается в универсальное вычислительное устройство и для построения на его основе полноценного компьютера нужно лишь добавить контроллер периферии и некоторый объем оперативной памяти.


AMD APU

Компания Intel первой представила прообраз подобной концепции. Им стали процессоры Clarkdale, но в них видеоядро и северный мост находились на отдельном полупроводниковом кристалле. Первым «настоящим» полностью интегрированными процессорами стали, как ни странно, энергоэффективные Intel Atom D410/D510, однако встроенное в них видеоядро не предназначено для выполнения математических расчетов, а служит лишь для формирования и вывода изображения. В компании AMD тоже времени зря не теряли, и в декабре 2010 года были анонсированы центральные многозадачные универсальные процессоры с графическим параллельным многоядерным ускорителем в одном кристалле. Такие гетерогенные процессоры получили название APU (Accelerated Processing Unit — ускоренный процессорный элемент). В ближайших планах компании — распространение этой архитектуры на все сегменты рынка, а пока же представлены только экономичные APU E-Series (Zacate) для настольных систем и C-Series (Ontario) для мобильных решений. Заметим, что полупроводниковые кристаллы первых APU выполнены с детализацией литографического процесса 40 нм.

AMD APU

Согласно перспективному роадмапу процессоров AMD, в 2011 году место производительных решений займут центральные процессоры под кодовым именем Zambezi, в основу которых ляжет новейшая микроархитектура Bulldozer. В среднем и бюджетном секторе появятся APU, состоящие из DX11-совместимого графического ядра и от двух до четырех вычислительных ядер c архитектурой Stars, хорошо знакомой нам по современным Phenom II и Athlon II. Кроме того, все новые процессоры AMD будут выпускаться по 32-нм техпроцессу. Планы на 2012 год обещают использование передовой микроархитектуры Bulldozer в APU среднего и бюджетного классов, интеграцию видеоядра в наиболее производительные процессоры, а также перевод наиболее экономичных решений для устройств AIO (All-in-One) на 28-нм нормы производства.

Вообще-то, в качестве платформы для экономичных встраиваемых систем и тонких клиентов компания AMD до недавнего времени предлагала лишь замедленные версии настольных процессоров и чипсетов, что в условии сильнейшей конкуренции со стороны Intel Atom уже не могло обеспечить оптимального соотношения энергоэффективности, цены и производительности. Поэтому появление гетерогенных процессоров на ядре Zacate пришлось очень кстати.

В состав APU входят одно или два х86 вычислительных ядра c микроархитектурой Bobcat, DX11-совместимое графическое ядро семейства Vancouver, встроенного одноканального контроллера памяти DDR3 и блок Platform Interface, выполняющего функции северного моста.

AMD APU

Типичное тепловыделение APU E-series укладывается всего в 18 Вт, что позволит в большинстве случаев обойтись пассивным охлаждением. Высокой энергоэффективности удалось достичь благодаря применению нового 40-нм техпроцесса наряду со схемотехническими оптимизациями и некоторыми особенностей микроархитектуры Bobcat, среди которых следует отметить:
  • двойной декодер команд х86;
  • 64 КБ L1-кэш и 512 КБ L2-кэш на каждое ядро;
  • улучшенный предсказатель ветвлений;
  • полное внеочередное исполнение команд;
  • мощный блок обработки операций с плавающей запятой;
  • поддержку 64-битных инструкций и аппаратной виртуализации;
  • динамическое управление частотой и питанием отдельных блоков;
  • дополнительное энергосберегающее состояние С6.
Информационно-диагностическая утилита CPU-Z версии 1.57 умеет достаточно точно определять все основные параметры APU Е-350.

AMD APU

Тактовая частота вычислительных ядер составляет 1600 МГц при напряжении 1,3 В, но для оптимизации энергопотребления процессор способен в моменты простоя снижать частоту до 800 МГц, снижая напряжение до 0,5 В. Более подробные характеристики в сравнении с Intel Atom представлены в таблице:

  Atom D425 Atom D525 AMD E-240 AMD E-350
Ядро Pineview Pineview Zacate Zacate
Разъем FCBGA559 FCBGA559 FT1 BGA FT1 BGA
Техпроцесс, нм 45 45 40 40
Кол-во транзисторов, млн 123 176 н/д н/д
Площадь кристалла, кв. мм 66 87 75 75
Частота, МГц 1800 1800 1500 1600
Множитель x9 x9 x15 x16
Кэш L1, КБ 32+24 32+24 x 2 32 + 32 32 + 32 x 2
Кэш L2, КБ 512 512 x 2 512 512 x 2
Кэш L3, КБ
Контроллер памяти Одноканальный
 DDR2 667/800 или DDR3 800
Одноканальный
 DDR2 667/800 или DDR3 800
Одноканальный
DDR3 800/1066/ 1333(O.C.)
Одноканальный
DDR3 800/1066/ 1333(O.C.)
Встроенное видеоядро GMA 3150 GMA 3150 Radeon HD 6310 Radeon HD 6310
Шина DMI DMI UMI UMI
Напряжение питания, В 0,8—1,175 0,8—1,175 1,175—1,35 1,25—1,35
Предельная температура, °C 100 100 90 90
TDP, Вт 10 13 19 19
Набор инструкций MMX, EM64T, SSE, SSE2, SSSE3 MMX, EM64T, SSE, SSE2, SSSE3 MMX, x86-64, SSE, SSE2, SSE3, SSSE3, SSE4A MMX, x86-64, SSE, SSE2, SSE3, SSSE3, SSE4A
Прочие особенности Hyper Threading
 Hyper Threading AMD-V AMD-V

На стороне Intel Atom меньшее энергопотребление, чуть большие частоты и поддержка Hyper Threading. Зато AMD APU имеет поддержку аппаратной виртуализации, инструкций SSE4A и чуть более производительный контроллер памяти за счет поддержки DDR3-1333.

Не менее интересно выглядит графическая часть APU Zacate — видеоядро HD 6310, состоящая из двух SIMD-массивов, которые в сумме имеют 80 потоковых процессоров и 4 блока ROP. Это очень неплохой показатель, который находится на уровне бюджетной дискретной графики Radeon HD 54xx, при этом тактовая частота потоковых процессоров составляет солидные 500 МГц. Очевидно, что львиная доля энергопотребления APU приходится именно на графическую подсистему. Последняя версия GPU-Z весьма примерно отображает характеристики HD 6310.

AMD APU

Помимо SIMD ядер видеоакселератор включает блок Unified Video Decoder третьего поколения, который поддерживает декодирование видеопотоков H.264, VC1, DivX/XVid, а также flash-видео при наличии соответствующего программного обеспечения. Как мы знаем, воспроизведение контента Full-HD в формате 1080р представляет весьма непростую задачу для неттопов и прочих компактных энергоэффективных систем, так что наличие блока UVD3 в составе APU можно только приветствовать. Графический адаптер обеспечивает поддержку DVI-D, HDMI и D-Sub. Максимальное разрешение изображения для DVI-D и HDMI составляет 1920х1200 точек, имеется возможность одновременной работы двух мониторов. Видеоядро HD 6310 имеет в своем составе звуковой кодек, который позволяет передавать через HDMI звук в цифровом формате. На фоне характеристик HD 6310 встроенное в Intel Atom D425/525 выглядит совершенно неубедительно, оно только формально поддерживает DirectX 10, не имеет аппаратной поддержки вершинных шейдеров и не способно ускорять видео H.264, VC1, DivX/XVid. К тому же, разрешение изображения при выводе на цифровые панели искусственно ограничено на уровне 1366х768.

Южный мост для APU Zacate предлагается только один — Hudson M1 FCH. Он производится по 65-нм техпроцессу и имеет типичное тепловыделение менее 5 Вт. Его основные возможности расширения выглядят вполне современно: шесть портов SATA 6 Гбит/с без поддержки RAID, 14 USB 2.0, поддержка HD-аудиокодеков и четыре линии PCI-E 2.0 для подключения дополнительных контроллеров.

AMD E-350 и Hudson M1 FCH

На наш взгляд, характеристики южного моста довольно сбалансированы, но не исключено появление в скором будущем как более простых, так и более производительных (например, с поддержкой USB 3.0 и SATA RAID) моделей.