Линейку профессиональных ускорителей Nvidia накануне возглавила модель Tesla P100, использующая 16-нм графический процессор Pascal GP100. Стоит отметить, что вычислительная мощность коммерческого продукта Tesla P100 ниже, чем, собственно, у полноценного GP100: серийный ускоритель оперирует только 56 из 60 потоковых мультипроцессорных блоков и, соответственно, 224 из 240 текстурных блоков, а также 3584 из 3840 шейдерных блоков.
Несмотря на урезанную функциональность, Tesla P100 способен дать фору любому из предшественников: при частоте ядра в boost-режиме, равной 1480 МГц, устройство P100 способно осуществлять операции с числами двойной точности (FP64-операции) с производительностью 5,3 Тфлопс. Разрядность шины памяти в 4096 бит и суммарный объем микросхем HBM2 в 16 ГБ остались нетронутыми. Энергопотребление Tesla P100 под нагрузкой составляет 300 Вт.
Tesla P100 позиционируется «как передовой ускоритель для сверхмасштабируемых дата-центров». Nvidia с гордостью заявляет, что P100 «поднимает на новый уровень производительность в ряде приложений высокопроизводительных вычислений и глубокого обучения». Среди таковых особо отмечены приложение молекулярной динамики AMBER, глубокая нейронная сеть AlexNet и приложение прогнозирования погоды COSMO.
Новые ускорители появятся в составе системы глубокого обучения Nvidia DGX-1 в июне. В свою очередь, производители серверов возьмут карты Tesla P100 на вооружение позже: серийные продукты на их основе дебютируют в начале 2017 года.
Источники:
Nvidia
VideoCardz