В свое время компания NVIDIA начала выпускать сверхбыстрые видеоадаптеры с претенциозным названием Titan. Недостижимая для других видеоускорителей производительность и внушительный ценник в 1000 долларов стали основными отличительными чертами этих элитных продуктов. AMD пошла по стопам конкурента и решила выпустить свой видеоадаптер без номерного индекса с не менее угрожающим названием Fury. Многозначительный заголовок кроме банального значения «ярость» (в переводе с английского) отсылает нас к античной мифологии, откуда произрастают корни и названия Titan. И если технологический рывок уникальное название вполне оправдывает, то рекомендованная цена нового флагмана AMD находится на уровне 650 долларов, что соответствует GeForce GTX 980 Ti. Такой подход демонстрирует трезвую оценку реального потенциала Radeon R9 Fury X со стороны производителя. Но на фоне определенного застоя в их графическом направлении даже полноценный конкурент GeForce GTX 980 Ti — реальное достижение и прорыв.
AMD Fiji
Видеоадаптер базируется на новом графическом процессоре с кодовым именем Fiji. Это первый GPU, использующий новый тип памяти HBM (High Bandwidth Memory), которая размещается рядом с кристаллом GPU на одной подложке.
HBM является новым этапом развития памяти. Общая тенденция в индустрии такова, что рост пропускной способности ОЗУ более слабый в сравнении с ростом производительности CPU и GPU. Поэтому крупные компании давно работают над новыми технологическими решениями. Одним из наиболее перспективных стандартов является HMC (Hybrid Memory Cube). Другой вариант — память HBM, которая разрабатывалась Hynix непосредственно при сотрудничестве AMD, и лучше всего подходит для использования в графических решениях.
Наращивание пропускной способности GDDR5 связано с дальнейшим ростом частоты, что требует большего напряжения и более сложной системы питания. По оценке AMD у современных видеокарт (вроде Radeon R9 290X) энергопотребление памяти может достигать 15–20% от общего значения. И в случае применения традиционных микросхем на их размещение требуется еще довольно много места на плате. Многослойная HBM-память поможет решить все проблемы. Она более эффективная по производительности, экономичнее и компактнее.
Если обычная память развивалась по принципу наращивая частот, то HBM предлагает максимально широкую шину при невысоких тактовых частотах. Чипы памяти в HBM многослойные. Чип Stacked Memory состоит из четырех банков памяти с внешним 1024-битным интерфейсом. При тактовой частоте модуля в 500 МГц (эффективное значение DDR 1000 МГц) пропускная способность достигает 128 ГБ/с на модуль. Для сравнения: одна микросхема GDDR5 при 32-битном интерфейсе обеспечивает лишь 28 ГБ/с в случае максимально возможной на сегодняшний день частоты 1750 МГц (эффективное значение 7 ГГц). При этом модули памяти HBM работают при 1,3 В вместо 1,5 В у GDDR5.
Первая версия HBM предусматривает использование четырех многослойных модулей при общей шине разрядностью 4096 бит. Это требует сложной разводки большого количества линий. Результатом становится интеграция основного процессора и памяти на одну подложку со специальным кремниевым слоем interposer, выполняемом на стандартном фотолитографическом оборудовании с соблюдением технологических норм 65-нм. В этом слое прокладываются все проводники, соединяющие между собой процессор Fiji и четыре чипа памяти.
Соединение между слоями памяти и коммуникация их с управляющей логикой осуществляется через сквозные проводниковые слои TSVs (Through-silicon vias). Соединение контактных зон у разных слоев, как и соединение со слоем interposer, реализовано при помощи микроскопических шариков металла (microbumps) на поверхности.
Технологически сложное устройство дорого обходится в производстве. Не удивительно, что освоение новой технологии начато именно с топового сегмента, где все финансовые затраты могут отбиться за счет высокой стоимости конечного изделия. Зато такая интеграция «спрессованной» памяти и GPU избавляет от лишней обвязки и позволяет работать с меньшими таймингами, не говоря уже об общем росте пропускной способности. Использование четырех многослойных модулей при эффективной частоте 1000 МГц обеспечивают пропускную способность 512 ГБ/с вместо 320 ГБ/с у старого флагмана Radeon R9 290X. Вот только реализация связки HBM и GPU пока возможна только в варианте с четырьмя блоками по 1 ГБ. Для многих современных игр этого вполне достаточно, но NVIDIA уже предлагает более емкие решения. Переход на HBM второго поколения с восьмислойными модулями позволит задействовать 8 ГБ. К тому времени с аналогичными продуктами может подоспеть и NVIDIA, ведь в планах компании тоже переход к данной технологии.
Непосредственно сам GPU Fiji выполнен по 28-нм техпроцессу на обновленной GCN-архитектуре, получившей номерной индекс 1.2. Переход на быструю энергоэффективную память позволил без роста общей мощности видеоадаптера нарастить количество вычислительных блоков. Новый процессор напоминает по структуре чип Hawaii. У него четыре крупных Shader Engine и аналогичная управляющая логика. У каждого Shader Engine по своему процессору обработки геометрии и по четыре укрупненных блока ROP. Общее количество блоков ROP одинаково с тем, что было у предшественников — их 64. Зато выросло количество основных вычислительных модулей Compute Unit — с 11 до 15 в одном Shader Engine. Структура Compute Unit остается неизменной, в активе каждого 64 ALU. В итоге у Fiji получается 4096 вычислительных единиц и 256 текстурных блоков, что на 45% больше чем у Hawaii.
Работа некоторых блоков оптимизирована и улучшена. Обещано небольшое ускорение Geometry Processor, что при сохранении их общего количества должно обеспечить преимущество относительно предыдущего GPU. Новичок сильно урезан по производительности в операциях с двойной точностью, это ударит по неграфическим вычислениям. Тут производитель пошел по пути NVIDIA, максимально оптимизируя производительность нового флагмана под игровые задачи. Увеличен объем кэш-памяти L2 до 2 МБ (в два раза больше кэша Hawaii). Восемь обновленных контроллеров памяти работают с HBM-памятью. Каждый контроллер связан с 256 КБ кэша и 8 ROP, работая с половиной многослойного модуля памяти. Частота GPU установлена на 1050 МГц
Процессор Fiji состоит из 8900 миллионов транзисторов и занимает площадь 600 мм². Примерно такие же параметры у топового процессора конкурентов GM200. В старом Radeon R9 290X при более скромных размерах кристалла остро стоял вопрос охлаждения. В Fury X его решили кардинально — на видеоадаптер установлена система водяного охлаждения.
Видеоадаптер | Radeon R9 Fury X | Radeon R9 390X | Radeon R9 290X |
Ядро | Fiji | Hawaii | Hawaii |
Количество транзисторов, млн. шт | 8900 | 6020 | 6020 |
Техпроцесс, нм | 28 | 28 | 28 |
Площадь ядра, кв. мм | 596 | 438 | 438 |
Количество потоковых процессоров | 4096 | 2816 | 2816 |
Количество текстурных блоков | 256 | 176 | 176 |
Количество блоков рендеринга | 64 | 64 | 64 |
Частота ядра, МГц | До 1050 | До 1000 | До 1000 |
Шина памяти, бит | 4096 | 512 | 512 |
Тип памяти | HBM | GDDR5 | GDDR5 |
Частота памяти, МГц | 1000 | 5000 | 5000 |
Объём памяти, МБ | 4096 | 4096 | 4096 |
Поддерживаемые API | DirectX 12, Vulkan, Mantle | DirectX 12, Vulkan, Mantle | DirectX 12, Vulkan, Mantle |
Интерфейс | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 |
Уровень TDP, Вт | 275 | 275 | 275–290 |
Заявлен уровень TDP в 275 ватт, что не отличается от показателей более слабого Radeon R9 390X. Проводятся даже аналогии с Radeon R9 290X, но тут ситуация запутанная. На момент запуска старого флагмана данные о его TDP скромно замалчивались, были неофициальные сведения о 290 Вт, позднее появились меньшие значения, которыми сейчас и оперируют для сравнений. Вряд ли Radeon R9 Fury X экономичнее решений на базе Hawaii.
Поддерживается технология TrueAudio. В GPU есть специальные блоки аппаратной обработки звука. Улучшены блоки кодирования/декодирования видеоконтента VCE/UVD. VCE работает с форматом H.264, а UVD научился работать с H.265.
Новинка полностью совместима с DirectX 12. Новый API обеспечит не только поддержку новых функций, но и общее ускорение производительности, лучшую работу многопроцессорных графических конфигураций. Так же в активе новинки поддержка API Mantle и Vulkan. Чуть подробнее о новых программных технологиях AMD вы можете прочесть в первом материале по новой серии Radeon.
Отдельно стоит отметить возможность ограничения fps, которая появилась в последних версиях программного обеспечения Catalyst. Далеко не все игры требуют максимальной отдачи от Radeon R9 Fury X. Для них и можно использовать ограничение fps. В меню Catalyst Control Center, раздел Performance, вы задаете ограничение от 55 до 95 fps, позволяя видеокарте работает не в полную мощь. В итоге она будет функционировать в более экономичном режиме, меньше греться и шуметь при сохранении полного комфорта в игре.
В том же разделе Performance есть настройки производительности и скорости вентилятора. Присутствует простейший инструментарий для разгона ядра. А вот разгон памяти заблокирован.
Среди программных инноваций AMD интерес пользователя вызовет технология Virtual Super Resolution, позволяющая выводить изображение в разрешении выше возможностей вашего монитора. С VSR можно задействовать разрешение 4K даже при обычном дисплее Full HD, что поднимает детализацию и четкость картинки.
На базе процессора Fiji запланировано несколько продуктов. Кроме топового Radeon R9 Fury X на рынке появится Radeon R9 Fury с меньшим количеством вычислительных блоков и воздушным охлаждением. Весьма интересным обещает быть видеоадаптер Radeon R9 Nano, который подвергнется еще большему урезанию, но будет еще экономичнее и дешевле. Есть информация, что готовится и двупроцессорный монстр с парой полноценных Fiji на борту.