
今年在GTC 2016期間宣布以CoWos製程整合技術進行封裝的加速卡Tesla P100之後,Nvidia稍早也針對一般工作站使用需求提供採PCI Express x16介面的Tesla P100,但兩者效能相比之下,後者僅對應單精度9.3TFLOPS與雙精度4.7TFLOPS的浮點運算效能,亦即為對應NVLink技術且採嵌入式設計的Tesla P100約89%效能。
針對傳統插卡式擴充設計的伺服器、工作站使用需求,Nvidia稍早宣布推出採PCI Express x16介面的Tesla P100,同樣採用Pascal顯示架構設計,但運算效能僅分別對應單精度9.3TFLOPS與雙精度4.7TFLOPS表現,亦即為對應NVLink技術且採嵌入式設計的Tesla P100約89%效能。
除了顯示核心運作時脈的差異,採PCI Express x16介面的Tesla P100分別提供搭載16GB、最大資料傳輸頻寬達720GB/s,或是12GB、最大資料傳輸頻寬達540GB/s的記憶體規格。
而接續推出此項產品,自然希望讓伺服器、工作站使用需求能有更大選擇彈性,例如採購全新伺服器需求的話,可以選擇對應NVLink技術且採嵌入式設計的Tesla P100,而預期從現有工作站,或是以更具性價比模式擴充工作站效能需求,則可選擇採PCI Express x16介面的Tesla P100。
至於此次推出採PCI Express x16介面的Tesla P100,本身同樣應用於大量數據演算的機器學習領域,而並非僅只能用於資料演算加速。