Radeon HD 7970. Новогодний флагман AMD. Часть первая

Вторая часть данного материала — Radeon HD 7970. Новогодний флагман AMD. Часть вторая


Трудности с освоением нового 28-нм техпроцесса немного сбавили темпы гонки между AMD и NVIDIA. Год назад были представлены флагманы прошлого поколения, и после довольно длительного периода доминирования AMD на рынке графических ускорителей их конкурент, наконец-то, смог уверенно потеснить «красных», выпустив GeForce GTX 580. И этот акселератор всерьез и надолго занял место лидера среди однопроцессорных решений. Но так было до недавнего момента. С анонсом Radeon HD 7970 компания AMD снова вырывается вперед — новый техпроцесс и новый уровень производительности дают шанс вернуть обратно пальму первенства.


Архитектура GCN и графический процессор Tahiti

Последние несколько лет архитектура графических процессоров AMD серьезно не менялась. Но прогресс диктует свои условия. Функциональность и сфера применения графических процессоров расширяются. Все более актуальными становятся неграфические вычисления, и технология GPGPU становится все более востребованной. Лидером в этой области является NVIDIA, которая всячески популяризовала свою платформу CUDA и с недавнего времени даже открыла доступ к исходному коду компилятора. Архитектура GeForce уже давно идет по пути унификации. И вслед за конкурентом, AMD переходит от VLIW к более гибкой и универсальной архитектуре под названием Graphics Core Next (GCN). Старая архитектура в первую очередь была ориентирована на графические расчеты, новая — на смешанные гетерогенные вычисления для одновременной обработки совместно с CPU. И это является одной из ступенек для дальнейшего развития гибридных процессоров Fusion.

В основе старой архитектуры лежали блоки SIMD Engine по 16 потоковых процессоров, которые выполняли одну VLIW-инструкцию над разными блоками данных. При неграфических вычислениях основной проблемой была полная загрузка SIMD-блока. Новая архитектура построена на более универсальных блоках GCN Compute Unit (CU), которые могут гибко распределять нагрузку.

AMD Tahiti

Каждый CU разбит на четыре векторных модуля по 16 ALU и имеет свой скалярный блок для контроля и управления потоками, а также выполнения отдельных операций, не являющихся частью основного массива обрабатываемых данных. У CU имеется локальная память объемом 64 КБ, кэш L1 на 16 КБ и свои блоки выборки и фильтрации текстур. Наличие внутреннего планировщика у такого GCN-блока позволяет им обрабатывать разные потоки и легко переключаться на другие задачи, обходясь без единого внешнего планировщика.

У каждых четырех модулей CU имеется общее хранилище 32 КБ для данных и кэш 16 КБ для инструкций. Общий объем кэша второго уровня в два раза выше, чем у Cayman, и достигает 768 КБ. Пропускная способность шин кэша L1 и L2 позволяет передавать 64 байта за такт. Общая пропускная способность для кэш-памяти первого уровня достигает 2 ТБ/с, для второго — 700 ГБ/с, что в два раза больше возможностей старого Cayman.

AMD Tahiti

Radeon предыдущих серий сильно уступали конкурентам из линейки GeForce при работе с тесселяцией. Поэтому значительному улучшению подверглись блоки обработки геометрии. Их по-прежнему два. Но производительность блока тесселяции значительно повысилась, а сам он получил принадлежность аж к 9 поколению. В определенных режимах обещано ускорение производительности при тесселяции до четырех раз. Но это в синтетике, в реальных играх разница будет значительно меньше. AMD говорит о приросте от 50 до 130% в сравнении с Radeon HD 6900, что тоже немало.

AMD Tahiti

В неграфических задачах прирост обещают не менее внушительный — от 1,4 до 4 раз в определенных расчетах и задачах.

Появилась поддержка алгоритма Ptex (Per-face texture mapping), который упрощает тесселяцию некоторых объектов. Вместо совмещения целой текстуры с моделью на каждый полигон накладывается отдельная текстура. А технология Partially Resident Textures позволит использовать видеопамять как кэш, в который по мере надобности будут подгружаться текстуры.

Новое поколение графических процессоров AMD совместимо с DirectX 11.1. К числу нововведений также относится поддержка API DirectCompute 11.1, OpenCL 1.2 и C++ AMP.

На базе новой архитектуры планируется в начале следующего года выпустить три линейки видеокарт. Флагманский GPU под кодовым именем Tahiti даст жизнь картам серии Radeon HD 7900, на базе Pitcairn увидят свет Radeon HD 7800, а Verde придет в средний класс с продуктами линейки Radeon HD 7700.

Блок-схема топового Tahiti приведена ниже.

AMD Tahiti

Этот графический процессор включает 32 GCN Compute Unit, каждый из которых насчитывает 64 ALU. А всего получается 2048 штук, что на треть больше, чем у Cayman. Общее количество текстурных блоков достигает 128 штук (96 у предшественника). Не выросло лишь число ROP — их по-прежнему 32. Шесть 64-битных контроллеров обеспечивают связь с памятью по 384-битной шине — прямо как у топового GeForce GTX 580 от NVIDIA. В таком полнофункциональном варианте выпускается Radeon HD 7970. У его младшего брата в лице Radeon HD 7950 часть GCN-блоков будет отключена. GPU у старшей карты работает на 925 МГц, что лишь на 45 МГц выше частоты графического процессора Radeon HD 6970. Память GDDR5 функционирует на 5500 МГц. И тут вообще никакой разницы с предшественником. Правда, у последнего шина 256 бит, так что его пропускная способность памяти заметно ниже. Объем видеобуфера вырос с двух гигабайт до трех.

Видеоадаптер Radeon HD 7970 Radeon HD 6970 Radeon HD 5870
Ядро Tahiti Cayman Cypress
Архитектура GNC VLIW4 VLIW5
Количество транзисторов, млн. шт 4312 2640 2154
Техпроцесс, нм 28 40 40
Площадь ядра, кв. мм 365 389 334
Количество потоковых процессоров 2048 1536 1600
Количество текстурных блоков 128 96 82
Количество блоков рендеринга 32 32 32
Частота ядра, МГц 925 880 850
Шина памяти, бит 384 256 256
Тип памяти GDDR5 GDDR5 GDDR5
Частота памяти, МГц 5500 5500 4800
Объём памяти, МБ 3072 2048 1024
Поддерживаемая версия DirectX 11.1 11 11
Интерфейс PCI-E 3.0 PCI-E 2.1 PCI-E 2.1
Заявленная потребляемая мощность в простое, Вт 3 20 27
Заявленная максимальная потребляемая мощность, Вт 250 250 188

Из-за кардинально переработанной архитектурой новый GPU стал намного сложнее и более громоздким. В итоге он даже обогнал GF110 по количеству транзисторов. Но благодаря более тонкому техпроцессу кристалл Tahiti по размерам не больше Cayman, и даже чуть меньше. Максимальный уровень энергопотребления тоже не вырос. И достигнуть этого помог не только новый технологический процесс производства, но и усовершенствованная технология AMD PowerTune. Процессор обладает еще более гибкой системой управления напряжениями и отключает функциональные блоки при простое видеокарты. По показателям энергопотребления в простое Radeon HD 7970 просто рекордсмен — всего 3 Вт! Технология PowerTune контролирует уровень TDP, регулируя рабочие частоты так, чтобы не превысит лимит. Сверхбыстрое реагирование возможно благодаря датчикам, отслеживающим загрузку всех блоков. Конечно, в реальных играх снижаться частоты не будут, а вот в Furmark такое возможно. Нельзя не вспомнить, что подобного рода «защита» от программ стресс-тестирования реализована и в последних видеокартах GeForce. PowerTune — технология аппаратная, но пользователь может корректировать максимальный уровень мощности с помощью соответствующего параметра в Catalyst Control Center.

В режиме длительного простоя при отключенном дисплее карта может полностью выключить вентилятор. Если в системе несколько видеокарт Radeon, которые объединены в CrossFireX, то в простом 2D-режиме простаивающие карты переводятся в самый экономичный режим и отключают вентилятор.

AMD Tahiti

Radeon HD 7970 и все последующие графические решения AMD обрели поддержку высокопроизводительной шины PCI Express 3.0. Хотя сомнительно, что для игровой карты даже такого уровня нужна быстрая шина. А вот для неграфических расчетов это будет более актуальным. Сохранена аппаратная совместимость со старыми стандартами PCI-E, так что никаких проблем с использованием новых видеоадаптеров на относительно старых системных платах быть не должно.

Получила развитие и технология AMD Eyefinity. Вместе с индексом 2.0 появилась поддержка HD3D для мультимониторных конфигураций. Radeon HD 7970 — первая карта AMD, которая позволяет выводить стереоизображение на три монитора. Специально для этого режима она обзавелась поддержкой интерфейса HDMI 1.4a frame packing, который (в отличие от простого HDMI 1.4a) позволяет передавать картинку в Full HD с частотой 60 Гц на глаз. Добавилась поддержка новых разрешений и конфигураций. Как и ранее, подключить к карте можно шесть мониторов. С помощью специального хаба к одному интерфейсу Display Port 1.2 возможно подключить три устройства. Правда, такие хабы появятся в продаже значительно позже.

Блок UVD в GPU Tahiti обеспечивает аппаратное декодирование данных в форматах MPEG-2/MPEG-4 (DivX), VC-1 и H.264. Для аппаратного кодирования видео появился специальный блок VCE, который может работать как совместно с потоковыми процессорами, так и сам обрабатывать видео. Новая технология AMD Steady Video позволит улучшить видео плохого качества и убрать дрожание камеры.

В числе уникальных достоинств Radeon HD 7970 — поддержка Ultra High Resolution. Тут новинка снова в роли первопроходца, хотя эра UHDTV пока еще кажется очень далекой.

AMD Radeon HD 7970

Новичок по своим размерам не отличается от референсных Radeon HD 6950/6970.

AMD Radeon HD 7970

Представители шеститысячной серии Radeon не отличались изысканным дизайном. Своими строгими угловатыми формами они напоминали кирпич. У Radeon HD 7970 более оригинальный внешний вид — черный округлый кожух с красными вставками.

AMD Radeon HD 7970

Смотрится очень симпатично. Глянцевая поверхность пластикового кожуха придает лоска.

AMD Radeon HD 7970

Сбоку расположены два разъема питания — один на шесть контактов, второй на восемь. AMD решила продолжить традицию использования двойного BIOS, которая взяла начало с Radeon HD 6950/6970. И возле пары разъемов CrossFire имеется соответствующий переключатель. Это весьма удобно для экспериментов с разгоном. Тем более, что одна микросхема недоступна для перепрошивки, и в случае какого-то сбоя всегда можно вернуться к рабочей конфигурации.

Обратная сторона платы уже не закрыта цельной пластиной.

AMD Radeon HD 7970

Набор разъемов на задней панели включает пару Display Port 1.2, один HDMI 1.4a и привычный DVI.

AMD Radeon HD 7970

За охлаждение видеокарты отвечает «турбина» стандартной конструкции. Это почти полная копия кулера Radeon HD 6970.

AMD Radeon HD 7970

Массивная испарительная камера с рядом алюминиевых пластин. Основание кулера — большая алюминиевая пластина, которая отводит тепло от микросхем памяти и силовых элементов. Вентилятор стал чуть больше, диаметр его увеличился на 5 мм, да и сами лопасти более широкие. Так что эффективность системы охлаждения по сравнению с предшественником тоже должна немного улучшиться.

AMD Radeon HD 7970

Оценить размеры радиатора можно по нижней фотографии, где видеокарта изображена без пластикового кожуха. Длина платы 27 сантиметров.

AMD Radeon HD 7970

Дизайн самой платы напоминает Radeon HD 6970 второй ревизии с шестифазной схемой питания графического процессора. Только используются другие компоненты.

AMD Radeon HD 7970

Впервые на референсном решении мы видим «мосфеты» в корпусе DirectFET, которые обладают самыми лучшими характеристиками в сравнении с другими полевыми транзисторами. Решение более дорогое, но и более надежное. И до появления Radeon HD 7970 такие компоненты использовались только MSI в своих топовых видеокартах оверклокерской серии Lighting.

AMD Radeon HD 7970

Системой питания управляет контроллер CHiL CHL8228G. Точно такой же использовался у Cayman. Так что после обновления MSI Afterburner можно рассчитывать на полноценную поддержку софтвольтмода.

CHiL CHL8228G

Вокруг кристалла GPU имеется большая рамка, которая надежно защищает его от сколов. Хотя и сама конструкция кулера исключает любую возможность его перекоса. На процессоре нет никакой маркировки. Все данные нанесены на рамку.

AMD Tahiti

Три гигабайта видеопамяти набраны 12 микросхемами Hynix H5GQ2H24MFR R0C, которые рассчитаны на частоту 6 ГГц.

Hynix H5GQ2H24MFR R0C


Последняя версия GPU-Z правильно определяет все параметры видеокарты. Графический процессор работает на 925 МГц, память — на 5500 МГц.

AMD Radeon HD 7970

Отслеживать температуру ядра можно с помощью GPU-Z или beta-версий MSI Afterburner 2.2.0. Последняя утилита не позволяет корректно менять частоты, но регулирует обороты вентилятора и поддерживает все функции мониторинга.

AMD Radeon HD 7970

Нагрузив видеокарту демо Ambush из Crysis Warhead Benchmarking Tool (на максимальных настройках качества изображения в разрешении 1920x1080 при AA8x) мы сумели прогреть GPU всего лишь до 75 °C в открытом корпусе при 24 градусах в помещении. И при такой умеренной температуре вентилятор раскручивался только до 2200 об/мин, так что уровень шума был невысокий. Отличный результат! Ведь за последние несколько лет пользователи привыкли к тому, что старшие графические ускорители горячие или громкие, а то сразу и те и другие одновременно.

Конечно, Crysis уже не сможет прогреть такую видеокарту по полной. Но даже после часа тестов в DirectX 11 температура не поднялась выше 76 °C. Все вроде отлично, и ничто не греется, однако в какой-то момент Radeon HD 7970 начал «радовать» нас сверхнизкими результатами и артефактами в играх. Все решилось довольно просто. После того, как карта остыла, мы загрузились и сразу же подняли обороты в MSI Afterburner до 60%. Это позволило нормально пройти все тесты заново. Причина такого поведения видеокарты не совсем ясна. Возможно, дело в «сыром» BIOS или программном обеспечении, из-за чего некорректно сработала система PowerTune, переводя карту в более медленный режим. Но это один из первых инженерных образцов видеокарты, первый BIOS и первый видеодрайвер. До официального старта продаж еще полторы недели и этого более чем достаточно для устранения каких-то огрехов в программном обеспечении. Так что потенциальным покупателям новинок бояться ничего не стоит.

Что же касается разгона, то пока весь инструментарий для этих целей ограничен возможностями Catalyst Control Center. Хотя ограничения там не такие уж и маленькие. AMD Overdrive позволяет поднимать частоту ядра до 1125 МГц, а памяти до 6300 МГц. Такой «запас» намекает на то, что 1 ГГц Tahiti должен взять с полпинка.

AMD Radeon HD 7970

Так это или нет, мы выясним в следующей части статьи. В данном обзоре сосредоточимся на производительности нового Radeon в номинальном режиме.

Характеристики видеокарт

В наше тестирование мы включили такие видеокарты:
  • Radeon HD 6970 (ASUS EAH6970 DCII/2DI4S/2GD5);
  • Radeon HD 6990 (PowerColor AX6990 4GBD5-M4D);
  • GeForce GTX 580 (Zotac GeForce GTX 580 AMP! Edition на пониженных до стандарта частотах).
Видеокарта ASUS идет с заводским разгоном 10 МГц по ядру. Но это настолько мизерная разница со стандартной частотой, что для тестов мы не стали ее снижать до 880 МГц.

Видеоадаптер Radeon HD 6990 Radeon HD 7970 ASUS Radeon HD 6970 GeForce GTX 580
Ядро Antilles Tahiti Cayman XT GF110
Количество транзисторов, млн. шт 2640x2 4312 2640 3000
Техпроцесс, нм 40 28 40 40
Площадь ядра, кв. мм 389x2 365 389 520
Количество потоковых процессоров 1536x2 2048 1536 512
Количество текстурных блоков 96x2 128 96 64
Количество блоков рендеринга 32x2 32 32 48
Частота ядра, МГц 800 (880*) 925 880 772
Частота шейдерного домена, МГц 800 (880*) 925 880 1544
Шина памяти, бит 256x2 384 256 384
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5
Частота памяти, МГц 5000 5500 5500 4008
Объём памяти, МБ 2048x2 3072 2048 1536
Поддерживаемая версия DirectX 11 11.1 11 11
Интерфейс PCI-E 2.1 PCI-E 3.0 PCI-E 2.1 PCI-E 2.0
Заявленная максимальная потребляемая мощность, Вт 350—375 250 250—190 244


Тестовый стенд

Конфигурация тестового стенда следующая:
  • процессор: Core i7-975 EE (3,2@4,15 ГГц, BCLK 173 МГц);
  • кулер: Thermalright Venomous X;
  • материнская плата: Gigabyte GA-X58A-UD3R (Intel X58 Express);
  • память: G.Skill F3-12800CL8T-6GBRM (3x2GB, DDR3-1600@1730 МГц, 8-8-8-24-1T);
  • жесткий диск: Hitachi HDS721010CLA332 (1 ТБ, SATA2, 7200 об/мин);
  • блок питания: FSP FX700-GLN (700 Вт);
  • операционная система: Windows 7 Ultimate x64;
  • драйвер Radeon: ATI Catalyst 11.12;
  • драйвер GeForce: NVIDIA GeForce 285.62.
В операционной системе были отключены User Account Control, Superfetch, Windows Defender и визуальные эффекты интерфейса. Настройки драйверов стандартные, без изменений.


Результаты тестирования

3DMark 11

3DMark 11

Тестирование Radeon HD 7970

Тестирование Radeon HD 7970

В 3DMark 11 новый Radeon обходит предшественника на 41—45% и не дотягивает до двухчипового видеоадаптера 27—31%. GeForce GTX 580 проигрывает новичку где-то 26—29%.


Crysis: Warhead

Crysis: Warhead

Два пятикратных прогона Ambush из Crysis Warhead Benchmarking Tool. Настройки графики максимальные (Enthusiast), сглаживание AA8x.

Тестирование Radeon HD 7970

В данной игре преимущество Radeon HD 7970 над однопроцессорными моделями намного скромнее. В этот раз ему даже не удается обогнать GeForce GTX 580 по минимальному fps. Да и по среднему показателю разница между ними небольшая — всего 10,7% в пользу новинки AMD.


Crysis 2

Crysis 2

Карты протестированы в «ручном» режиме при помощи Fraps. Для теста выбран небольшой эпизод на первом уровне. Прогулка по скверику с расстрелом камней и водной поверхности. Три повтора для каждого режима. Настройки графики максимальные с включенными улучшенными текстурами в разрешении 1920x1080.

Тестирование Radeon HD 7970

В Crysis 2 Radeon HD 7970 выглядит намного лучше. Отрыв от Radeon HD 6970 достигает 50% по среднему fps. GeForce GTX 580 отстает на 24%. Очень маленькая разница с двухчиповым Radeon HD 6990, а по минимальному fps этот двуглавый титан даже хуже. Дело в большом разбросе по минимальному fps. И хотя мы дополнительно увеличили число прогонов до 6, но все равно получали на этой карте от 16 до 31 fps.


Metro 2033

Metro 2033

Стандартный игровой бенчмарк Frontline. Три пятикратных прогона. Настройки графики максимальные. Тесселяция и Depth of Field включены.

Тестирование Radeon HD 7970

Тестирование Radeon HD 7970

Отличный результат без сглаживания. А вот с AA4x мощности нового Radeon все равно не хватает. Предшественник слабее на 28—36%, GeForce GTX 580 — на 11—14%.


Battlefield 3

Battlefield 3

Частота кадров измерялась с помощью Fraps. Выбрана миссия «Молот и наковальня» (Rock and a hard place). После первой контрольной точки мы спускаемся по склону холма в долину до укреплений врага. Тестовая сценка включала, кроме спуска, начало перестрелки при штурме первого ряда укреплений. Огонь велся по двум точкам из-за укрытия через прицел. С учетом простого спуска общий порядок действий легко повторим, а итоговые результаты не зависят от случайных факторов. Плюс в кадре находится не только большая площадь с детализированными текстурами, но и световые эффекты выстрелов, и парочка взрывов. Это помогает создать максимально адекватную картину реальной производительности, как в сложных насыщенных сценах одиночной кампании, так и в многопользовательских схватках. Три повтора. Настройки в положении Ultra при сглаживании AA4x.

Тестирование Radeon HD 7970

А вот в этой игре GeForce GTX 580 и вовсе наступает на пятки новичку AMD. Между ними разница всего лишь 5%.


Выводы

С выпуском Tahiti начинается новая эра для видеокарт Radeon. Прогрессивная архитектура станет основной для дальнейшего развития графических ускорителей AMD в ближайшие годы. В области неграфических вычислений компания AMD сделала значительный шаг вперед, который позволит не только отвоевать свою долю рынка в этой сфере, но и далее развивать и совершенствовать гибридные процессоры Fusion. Но нас в первую очередь интересует игровая производительность нового Radeon HD 7970. С этим у него тоже все обстоит отлично. Он демонстрирует значительное преимущество над предшественником Radeon HD 6970, которое иногда достигает 30—50%. И недавний одночиповый флагман GeForce GTX 580 тоже сдается под натиском мощного новичка AMD. Разница между ними уже поменьше, иногда и вовсе в несколько кадров. Но, к примеру, результаты в Crysis 2 у Radeon просто отличные. Явно сказывается повышение производительности при обработке тесселяции, что было слабым местом старых видеоадаптеров AMD. Благодаря новому 28-нм техпроцессу столь мощное графическое решение по уровню энергопотребления не превысило аппетитов старшего одночипового ускорителя шеститысячной серии. А конкурент от NVIDIA по этому параметру и вовсе окажется в невыгодном положении. Несмотря на заявленные цифры его реальное энергопотребление значительно выше Radeon HD 6970. Еще Radeon HD 7970 является пока что единственным видеоадаптером с поддержкой DirectX 11.1. Среди своих товарищей он также пока единственный, кто предлагает HD3D с поддержкой нескольких мониторов.

Прогрессивное решение с отличным сочетанием потребительских характеристик. Минус у него один — цена. Рекомендованная стоимость составляет 550 долларов, и это самая дорогая однопроцессорная видеокарта в истории ATI/AMD. Вряд ли цена существенно изменится до тех пор, пока NVIDIA не выпустит свои модели нового поколения. Если лишние деньги жмут вам карман, то можете готовиться к покупке — в январе Radeon HD 7970 уже будут доступны в магазинах. Более экономные энтузиасты могут подождать младший Radeon HD 7950, который тоже обещает выйти очень интересным продуктом.

В данной статье мы обошли стороной разгон. Да и набор тестов был невелик. Но, как понятно из названия — это не последняя наша встреча с Radeon HD 7970. Во второй части обзора вы увидите больше игровых приложений и участников. Конкурентов мы сравним не только на стандартных частотах, но и при разгоне. Посмотрим, сможет ли разогнанный Radeon HD 7970 сравнятся с двухчиповым титаном Radeon HD 6990, и удастся ли GeForce GTX 580 компенсировать свое отставание от новичка благодаря повышению частот.