NVIDIA 在日前的 GTC 線上主題演講宣布 Ampere 架構的 NVIDIA A100 GPU ,而藉著 ISC 2020 前夕, NVIDIA 再發表針對小型工作站、研究機構的 PCIe 版本的 NVIDIA A100 ,相較先前發表的 SXM 介面版本,除了連接介面的改變之外,也針對散熱設計調降功耗,不過由於新架構的加持,仍在 AI 性能比起上一代 V100 提升達 20 倍。
NVIDIA A100 PCIe 版本維持使用 A100 晶片,搭配 40GB 的三星 HBM2 記憶體,功耗因應散熱設計由 400W TDP 調降為 250W TDP ,但保有整合 TF32 與支援 FP64 的第三代 TensorCore ,並可支援結構化稀疏技術、 MIG 多重執行個體 GPU 等功能,至於 PCIe 介面也採用新世代的 PCIe 4 ,能夠利用 NVLink 連接器進行雙卡連接。
NVIDIA A100 介紹可見先前 GTC 線上主題演講發表活動:GTC 2020 : NVIDIA 發表地表最大 7nm 晶片、 Ampere 架構的 NVIDIA A100 GPU ,AI 性能提升 20 倍、具創新多重執行個體設計
▲ A100 在 AI 運算較 Volta 提升 20 倍、而 FP64 HPC 性能也提升 2.5 倍
▲多家系統業者也陸續宣布搭載 A100 PCIe 、 A100 SXM 的工作站與超算系統
▲ A100 GPU 具備的六項關鍵特色
▲ PCIe 版與 SXM 版除了通道設計不同與 NVLink 可連接的ink 可連接的 GPU 最高數量外, PCIe 版的 TDP 也自 400W 降至 250W
根據 NVIDIA 的說法, NVIDIA A100 PCIe 是鎖定小型工作站與科學研究等 AI 與運算領域,而 SXM 版本則藉由使用具備 NVLink 通道與 NVSwitch 介面之 HGX 提供 4 卡到 8 卡的 HPC 層級運算效能(註, 4 卡 HGX 以 NVLink 直接連接, 8 卡則搭配 6 組 NVSwitch 連接),兩者針對不同領域提供產品差異化,使研究者與超算應用能夠選擇合宜的產品。
雖然形式不同,不過 NVIDIA A100 PCIe 同樣可支援多達 50 種 CUDA-X 庫,提供圖形加速、圖像仿真、 AI 、 CUDA 11 ,針對多模式對話 AI 的 Jarvis ,深度推薦程式應用程式框架的 Merlin ,針對 HPC 的 NVIDIA HPC SDK 等。
截至目前為止,已有 50 套搭載 NVIDIA A100 GPU 的系統公布,包括華碩、 Atos 、 Cisco 、 Dell 、富士通、技嘉、 HPE 、 Inspur 、 聯想、 One Stop System 、 廣達/雲達與 Supermocro 等,目前有 30 款系統已經發表上市,至年底前還有 20 款系統陸續推出。