Обзор архитектуры Cypress и видеокарты Radeon HD 5870

Представив в конце прошлого года новое поколение видеокарт серии Radeon HD 5000, компания AMD впервые за долгое время уверенно и прочно закрепилась на рынке в качестве лидера 3D-графики. Этому способствовала не только значительно возросшая производительность новых видеоадаптеров относительно предшественников, но и поддержка нового API DirectX 11, и выпуск чипов по прогрессивному 40-нм техпроцессу (который они начали осваивать еще с выпуском Radeon HD 4770).

Radeon HD 5870

Ранее AMD заявляли о том, что одночиповые решения рассчитаны в первую очередь для решений среднего класса и low-end, а будущее высокоуровневых продуктов за мультичиповыми картами. Но после выпуска довольно успешного графического процессора RV870 под кодовым именем Cypress об этой стратегии временно подзабыли. Это и неудивительно, учитывая, что старшая видеокарта Radeon HD 5870 достигла по производительности бывшего флагмана AMD — Radeon HD 4870X2.


Cypress

Архитектура Cypress получила название TeraScale 2. Двойка в названии намекает на новый уровень производительности — 2,7 терафлоп в вычислениях с одиночной точностью и 544 гигафлоп для чисел с плавающей запятой FP64. Сама же структура RV870 на первый взгляд кардинально не изменилась относительно предшественника, заметно возросло лишь число вычислительных блоков.

Cypress

Основу нового графического процессора оставляют 20 SIMD-ядер, каждое из которых включает 16 универсальных суперскалярных потоковых процессоров, устройство которых идентично таковым у RV770/RV790 — четыре исполнительных блока и один блок Special functions, что позволяет одному такому процессору выполнять пять операций за такт. Соответственно и вместо 320 вычислительных блоков AMD оперирует цифрой в 1600 блоков (320х5), что ровно в два раза больше чем у одночиповых флагманов прошлой серии или столько же как у двихчипового Radeon HD 4870X2.

Cypress

На каждый блок SIMD было выделено по 4 текстурных блока, т.е. всего их 80, что, опять же, в два раза больше чем у RV770 и RV790. Число блоков ROP тоже выросло в два раза — теперь их 32.

Эффективность работы всех блоков была повышена, как и привнесены некоторые изменения в соответствии с требованиями нового DirectX 11. В частности, введено два блока растеризации, что не актуально для старых приложений, но положительным образом скажется при работе с тесселяцией.

Cypress

Также в соответствии с требованиями нового API блоки TMU научились работать с текстурами размером до 16384х16384 и появились новые режимы сжатия HDR-текстур. Используется новый более качественный алгоритм анизотропной фильтрации. Был доработан фирменный метод сглаживания CFAA, а благодаря возросшему числу ROP и стандартные режимы MSAA даются с минимальным падением производительности. Даже для 8х MSAA эта оно не должно превышать 15%. Цифры конечно обнадеживающие, но в реальности производительность может упереться в другие «узкие» места архитектуры, в частности, в пропускную способность памяти.

В этом отношении кардинальных преобразований у RV870 нет — он все так же сообщается с памятью по 256-битной шине. И хотя частота памяти GDDR5 у старшей карты возросла до 4800 МГц, в итоге ПСП относительно старого Radeon HD 4890 увеличилась лишь на 26%. Сам же контроллер построен по хабовому принципу. Четыре 64-битных контроллера расположены возле основных потребителей данных, а менее требовательные блоки соединены с ними через хаб.

Cypress

Ядро RV870, несмотря на значительно возросшее число вычислительных блоков, по площади превосходит RV770/RV790 лишь на треть и занимает 334 кв. мм. Заслуга этого, конечно же, в 40-нм техпроцессе, который позволяет добиться таких компактных размеров. Да и пиковое энергопотребление 188 Вт у Radeon HD 5870 не намного выше, чем у Radeon HD 4870 (160 Вт) и даже ниже чем Radeon HD 4890 с ее 190 Вт. Энергопотребление в простое и вовсе составляет рекордно низкие 29 Вт благодаря в очередной раз усовершенствованной технологии ATI PowerPlay. Специальный блок отслеживает загрузку GPU и подбирает оптимальный рабочий режим для чипа и памяти. Для памяти GDDR5 даже появился специальный экономный режим — low power strobe mode. Применен аппаратный контроль даже для блока VRM карты, что совсем не лишнее, учитывая каких высоких температур достигали эти компоненты на видеоадаптерах прошлых серий.

На базе графического ядра Cypress на данный момент выпускаются две модели — Radeon HD 5870 и Radeon HD 5850.

Видеоадаптер Radeon HD 5870 Radeon HD 5850 Radeon HD 4890 Radeon HD 4870 Radeon HD 4850
Ядро Cypress (RV870) Cypress (RV870) RV790 RV770 RV770
Количество транзисторов, млн. шт 2,15 млд. 2,15 млд. 959 956 956
Техпроцесс, нм 40 40 55 55 55
Площадь ядра, кв. мм 334 334 282 263 263
Количество потоковых процессоров 1600 1440 800 800 800
Количество текстурных блоков 80 72 40 40 40
Количество блоков рендеринга 32 32 16 16 16
Частота ядра (номинал), МГц 850 725 850 750 625
Частота шейдерного домена (номинал), МГц 850 725 850 750 625
Шина памяти, бит 256 256 256 256 256
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5 GDDR3
Объём памяти, МБ 1024 1024 1024 512/1024 512
Частота памяти (номинал), МГц 4800 4000 3900 3600 1986
Поддерживаемая версия DirectX 11 11 10.1 10.1 10.1
Интерфейс PCI Express 2.1 PCI Express 2.1 PCI Express 2.0 PCI Express 2.0 PCI Express 2.0
Потребляемая мощность, нагрузка/простой, Вт 188/27 170/27 190/60 160/90 110/na

Кроме различия в частотах (850/4800 МГц у старшей карты против 725/4000 МГц у младшей), Radeon HD 5850 отличается и меньшим числом вычислительных блоков — в GPU отключены два SIMD-ядра и общее число вычислительных блоков равно 1440 вместо 1600. Соответственно и число активных TMU уменьшено до 72. Разница небольшая и к существенному падению вычислительной мощности она, конечно, не приведет. Зато выпуском карт HD 5850 компания AMD не только заполняет чуть более дешевую ценовую нишу, но и избавляется от бракованных RV870, у которых не все вычислительные блоки оказались рабочими.


DirectX 11


Немного нужно остановиться и на новом API от Microsoft, который несет ряд существенных улучшений в плане визуализации. Новая Shader Model 5 имеет унифицированный набор команд для работы шейдеров всех типов – Vertex, Geometry, Pixel, Compute и новых Hull, Domain. Последние два типа шейдеров были специально введены для реализации тесселяции. Сама же эта технология, позволяющая значительно увеличить детализацию объектов, уже повсеместно внедряется в новые игровые проекты.

DirectX 11

DirectX 11

В S.T.A.L.K.E.R. Зов Припяти ее поддержка добавляется специальным патчем, а вышедший недавно автосимулятор Colin McRae DIRT 2 изначально мог похвастать этим.

DirectX 11

DirectX 11
Наглядное сравнение применений тесселяции в Unigine Haven Benchmark и S.T.A.L.K.E.R. Зов Припяти

DirectX 11
DIRT 2 в DX9 и DX11

Последняя игра, кстати, работает только или в DirectX 9 или в DirectX 11, как-то обходя стороной возможности DirectX 10, что, скорее всего, стало плодом тесного сотрудничества разработчиков и AMD (о чем последние не раз упоминали). Учитывая опыт конкурентов из NVIDIA по внедрению PhysX, «заточенного» исключительно под их карты, неудивительно, что и AMD решила начать продвигать на рынок игры, оптимизированные под свои решения.

Еще одним ожидаемым проектом с поддержкой тесселяции станет римейк Aliens vs Predator, который должен появиться на прилавках уже в этом месяце. Сам проект изначально создавался на устаревшем движке и первые скриншоты напоминали игры пятилетней давности. Но стоило подключиться AMD, как разработчики добавили тесселяцию, и перед нами предстал визуально уже совершено другой проект!

DirectX 11

DirectX 11

Также одной из важных особенностей нового DirectX является DirectCompute, который обеспечивает поддержку вычислений общего назначения на GPU (в случае с AMD это ATI Stream Technology). Новый API поддерживает как более старую версию DirectCompute 10 под предыдущее поколение видеокарт, так и новый более функциональный DirectCompute 11, который может быть использован для создания более сложных (и, следовательно, красивых) эффектов постобработки, таких как изменение глубины резкости (depth of field) или смазывания изображения при движении (motion blur), а также проводить расчет физических эффектов и алгоритмов искусственного интеллекта.

DirectX 11

Постобработка с использованием DirectCompute позволяет использовать более совершенные алгоритмы обрисовки теней при использовании ambient occlusion. На скриншоте ниже как раз проиллюстрирована работа такого улучшенного режима HDAO (High Definition Ambient Occlusion) на картах AMD. По мере удаления от наблюдателя тень не остается четкой, а все больше смазывается, что более приближено к реальному восприятию глазом таких объектов в жизни.

DirectX 11

DirectCompute также применяется для оптимизации эффектов постобработки в уже упоминавшемся Colin McRae DIRT 2.

Кроме того, Cypress поддерживает еще один открытый API — OpenCL, который позволяет производить вычисления силами графического процессора, исполняя одни и те же команды, предназначенные для GPU и CPU. При поддержке со стороны разработчиков ПО на видеокартах AMD можно будет значительно увеличить скорость кодирования видео, проведения нелинейного монтажа, различных расчетов. На данный момент подобным могут похвастаться решения на базе GPU NVIDIA. Для игроков это выльется в поддержку физических эффектов в будущих играх, так как OpenCL имеет больше перспектив, чем закрытый PhysX, NVIDIA.

Немаловажным для тех, кто нацелен на будущие многочиповые видеоадаптеры, станет улучшенная поддержка многопоточности в DirectX 11. Более совершенный в этом отношении API позволяет надеяться, что будущие многочиповые решения будут демонстрировать еще больший прирост относительно своих одночиповых решений.

Что касается использования DirectX 11, то этот API доступен не только пользователям ОС Windows 7, но Windows Vista через систему обновления Windows Update.


Технология ATI Eyefinity

Еще одно нововведение в видеокартах AMD — технология ATI Eyefinity, которая позволяет создавать мультимониторные конфигурации до шести дисплеев.

ATI Eyefinity

Все эти мониторы можно использовать как в режиме клона, так и в режиме расширения рабочего стола. Для реализации такого домашнего виртуального центра понадобятся специальные версии Radeon HD 5870 Eyefinity Edition (Radeon HD 5870 SIX) с шестью разъемами Mini DisplayPort. На обычных моделях Radeon HD 58xx реализовано лишь четыре разъема для подключения дисплеев: два Dual-Link DVI и по одному HDMI и DisplayPort, позволяющие подключить до трех дисплеев.

ATI Eyefinity

ATI Eyefinity

ATI Eyefinity

Но поддержка такой конфигурации должна присутствовать и в самом приложении, и с этим особых проблем нет. На данный момент около 80 игр (среди которых такие хиты как Crysis, GRID и DIRT 2) могут работать с ATI Eyefinity и список этот будет постоянно расширяться.

Для продвижения этой технологии AMD сотрудничает и с производителями мониторов. Samsung выпускает специальные версии мониторов диагональю 23 дюйма, интерфейсом DisplayPort и очень тонкой рамкой.

Стоит отметить и некоторые улучшения в выводе видеоконтента через HDMI. Новые видеокарты обзавелись поддержкой этого стандарта под ревизией 1.3a с поддержкой высококачественных аудиоформатов Dolby TrueHD и DTS-HD Master Audio, всех стандартов Blu-ray и привычных уже аудиоформатов AC-3 и DTS. Все это правда будет более актуально для low-end видеоадаптеров AMD новой серии, которые обычно как раз и используются как база для мультимедиа-центров и HTPC.
Разогнать, чтобы выиграть!