Компания NVIDIA представила новый класс графических процессоров Rubin CPX для вычислений искусственного интеллекта. Эти GPU ориентированы на задачи вывода (инференса) с большими контекстными окнами и на генеративные видеоприложения.

Анонсированный чип выполнен на монолитном кристалле, оснащен 128 ГБ памяти GDDR7 и обеспечивает производительность до 30 PetaFLOPS в формате NVFP4. Также чип имеет четыре встроенных блока кодирования/декодирования видео NVENC и NVDEC, что важно для обработки видео. Как видим, GPU заметно отличается от Blackwell и Blackwell Ultra, которые используют дизайн с двумя кристаллами и несколькими стеками памяти HBM. Но это чип узкой специализации, будут и более крупные процессоры Rubin с памятью HBM для более широкого спектра задач ИИ.

Новые чипы Rubin CPX будут использоваться в серверных системах NVIDIA Vera Rubin NVL144 CPX, которые получат 144 больших графических чипов Rubin, 144 специализированных чипов Rubin CPX и 36 процессоров Vera в одной стойке. Такая стойка обеспечит производительность до 8 exaFLOPS в NVFP4 при общем объеме памяти 100 ТБ. Устройства работают на базе сетевой платформы NVIDIA Spectrum‑X Ethernet с технологией NVIDIA Spectrum-XGS Ethernet и сетевыми адаптерами NVIDIA ConnectX‑9 SuperNIC с переходом на соединения с использованием оптических кабелей.

Также NVIDIA предложит стойку Vera Rubin NVL144 без специализированных чипов Rubin CPX и двухстоечную систему, которая сочетает Vera Rubin NVL144 и Vera Rubin NVL144 CPX.

NVIDIA планирует запустить Vera Rubin NVL144 CPX в продажу до конца 2026 года. Возможно будут доступны и дискретные версии NVIDIA Rubin CPX.

Источники:
NVIDIA
VideoCardz