
去年正式揭曉Pascal顯示架構後,Nvidia在此次GTC 2016宣佈推出首款應用Pascal顯示架構的加速卡Tesla P100,相比Maxwell顯示架構約提升12倍效能,並且可藉由NVLink技術最多8組Tesla P100彼此互連,藉此建立最高提升5倍頻寬加速效果。
Nvidia執行長黃仁勛稍早於GTC 2016首場主題演講正式揭曉首款應用Pascal顯示架構的加速卡Tesla P100,同時確認Pascal顯示架構將以台積電16nm FinFET製程技術生產,並且導入1500億組電晶體、三星製作HBM2記憶體模組 (每組4GB,總計16GB容量),透過CoWos (Chip-On-Wafer-On-Substrate)製程整合技術進行封裝。相比Maxwell顯示架構將提供多達3倍記憶體 (每秒720GB)頻寬加速效果,同時應用在神經網路訓練內容也比Maxwell顯示架構提升12倍率效能。
Tesla P100配合全新半精度指令 (half-precision instruction)運作,約可在深度學習應用情況下提供超過21.2兆次浮點數運算 (TFLOPS)效能。而藉由NVLink連接技術,最多可同時串接8組Tesla P100,藉此建立最高提升5倍頻寬加速效果。
首波應用Tesla P100加速卡的伺服器廠商包含IBM、Hewlett Packard Enterprise (HPE)、Dell與CRAY,相關產品預計將在2017年第一季內陸續推出。