Компанія розповіла про свій новий чип Blackwell Ultra, який лежить в основі прискорювачів NVIDIA GB300 для обчислень штучного інтелекту. Це друге покоління на основі архітектури Blackwell з рекордним обсягом пам’яті HBM3E у 288 ГБ.

Чип використовує два кристали GPU, які об’єднані інтерфейсом NV-HBI зі швидкістю 10 ТБ/с. Весь процесор налічує приблизно 2088 мільярдів транзисторів. Кожен із двох кристалів GPU налічує 160 SM по 128 ядер CUDA в кожному. Тобто в одного кристала всього 20480 ядер CUDA замість 18432 у першій версії Blackwell. Процесор оснащений тензорними ядрами п’ятого покоління з підтримкою обчислень у форматі FP8, FP6 і в новому форматі NVFP4. У кожного SM по 256 КБ тензорної пам’яті та 40 МБ тензорної пам’яті на кристал.

Також є додаткові блоки для спеціальних математичних функцій. Пам’ять набрана вісьмома стеками HBM3E загальним об’ємом 288 ГБ (у першій версії Blackwell було 192 ГБ). Пропускна здатність пам’яті залишилася на колишньому рівні 8 ТБ/с. Пікова продуктивність чипа Blackwell Ultra досягне 15 PetaFLOPS у режимі NVFP4 замість 10 PetaFLOPS у Blackwell першого покоління. Параметр енергоспоживання TGP підвищено до 1400 Вт.

Такий обчислювальний монстр став основою для суперчипа NVIDIA Grace Blackwell Ultra GB300, який складається з двох чіпів Blackwell Ultra та одного центрального процесора Grace. Обмін даними між графічними чипами відбувається по шині NVLink-C2C. Потенціал такого пристрою 30 PFLOPS у NVFP4 або 40 PFLOPS у режимі sparse. Мережеві адаптери ConnectX‑8 SuperNIC забезпечують високошвидкісне мережеве підключення зі швидкістю 800 Гбіт/с.

Такі суперчипи є основним елементом для стійкових серверних систем NVIDIA GB300 NVL72. Усередині такої стійки об’єднано 36 пристроїв Grace Blackwell Ultra з рекордною продуктивністю до 1,1 exaFLOPS. Такі системи використовують водяне охолодження та інноваційні технології в управлінні живленням.

NVIDIA заявляє, що GB300 вже перебувають на стадії масового виробництва і постачаються першим замовникам. Наступного року будуть представлені пристрої на архітектурі Rubin, розробка якої вже завершена.

Джерела:
NVIDIA
Videocardz