Компанія NVIDIA провела спеціальну презентацію у Вашингтоні, на якій Дженсен Хуанг особисто продемонстрував нову обчислювальну платформу Vera Rubin для штучного інтелекту. Це покоління великих чипів анонсували ще торік, а навесні на міжнародній конференції GTC 2025 представили характеристики й особливості нової платформи. Тепер нам наживо показали Vera Rubin і розповіли про деякі особливості серверних рішень.
Так званий суперчип Vera Rubin є комбінованим обчислювальним пристроєм, що об’єднує на одній платі новий Arm-процесор Vera та два графічні чипи Rubin. Такі великі суперчипи орієнтовані на потужні обчислювальні центи, які називають ШІ-фабриками. Один графічний процесор Rubin забезпечить продуктивність 50 петафлопс у форматі FP4 й отримає 288 ГБ швидкої пам’яті HBM4 з пропускною здатністю 13 ТБ/с. Процесор Vera отримав 88 ядер, які обробляють 176 потоків. Швидкий обмін даними між GPU і CPU забезпечує надшвидкий інтерфейс NVLink-C2C з пропускною здатністю 1,8 ТБ/с. Уся платформа пропонує до 2 ТБ швидкої пам’яті, включно з HBM4 і LPDDR. А загальна продуктивність у ШІ-обчисленнях досягне 100 петафлопс.
Vera Rubin стане основою для серверних систем NVL144 із загальною продуктивністю 3,6 екзапфлопс у FP4 та 1,2 екзапфлопса в FP8. Це приблизно в 3,3 раза швидше за сучасні системи GB300 NVL72. Також компанія в майбутньому представить NVL576 на базі другого покоління чипів Rubin Ultra.
Один блок зі стійкової системи NVL144 об’єднує два суперчипи Vera Rubin, пропонуючи до 200 петафлопс в обчисленнях FP4 за пропускної здатності NVLink 14,4 ТБ/с, плюс мережеве з’єднання за допомогою адаптера Connect X‑9 800 Гбіт/с.
Одночасно компанія запропонує системи Vera Rubin NVL144 CPX, які отримають додаткові чипи Rubin CPX для прискорення обробки ШІ з великим контекстом.
Виробництво Vera Rubin стартує наступного року, і до кінця року компанія анонсує рішення Rubin Ultra. У 2027 році їх змінять рішення на базі чипів Feynman.
Джерело:
Videocardz




