NVIDIA 揭曉全新 Arm 架構 CPU「Grace」不再受限 x86架構未來可提供完整 AI、超算伺服器設計方案 (161096)

照片中提到了**、COMO HOPPE.，包含了格蕾絲·墨瑞·漏斗、寬限料斗、電腦、程式語言、電腦編程

「Grace」CPU的設計，對於NVIDIA至關重要的原因，是增加自有人工智慧、超算等級CPU產品製作能力，無須完全受限於Intel、AMD合作關係，在伺服器應用發展更是多了話語權，不再只是以GPU加速應用立場自居，更能提供完整人工智慧及超算伺服器設計應用方案。

下一款顯示架構到底是不是「Hopper」？

今年維持以線上形式舉辦的GTC 2021期間，NVIDIA正式揭曉以Arm架構打造的「Grace」CPU，並且宣布擴展Arm在智慧型手機以外的市場生態規模。而為什麼在此時推出「Grace」CPU，對於NVIDIA而言會是至關重要？

「Grace」CPU不是用來取代現有x86架構CPU

簡單回顧一下「Grace」CPU的設計，本身是以台積電5nm製程打造，並且以美國知名女性電腦科學家，同時也是當時美國海軍准將身分的Grace Hopper為稱，設計上則採用Arm Nerverse架構。

實際上，關於「Grace」CPU的深入細節，NVIDIA在此次GTC 2021並未進一步說明，僅透露採用對應Arm新版指令集與全新核心設計。而在NVIDIA釋出設計圖像中，「Grace」CPU是以MCM (Multi-Chip Module,多晶片模組)形式與NVIDIA據說是下一款GPU封裝於單一板模，同時也整合對應CPU使用的LPDDR5X ECC記憶體模組，以及提供GPU使用的顯示記憶體，至於對於下一款GPU的相關細節，目前NVIDIA也未多作說明。

不過，NVIDIA說明中詮釋一個重要想法，就是依然認為縱使GPU運算效能再強大，依然需要配合CPU協助處理資料存取、執行指令集，GPU本身定位依然是作為運算加速用途，因此在對外說明時仍強調會繼續維持與x86、Power架構設計處理器維持合作，意味就算推出「Grace」CPU，與Intel、AMD及IBM等處理器業者合作關係並不會改變。

▲「Grace」CPU

並非NVIDIA第一款CPU，亦非第一款Arm架構產品

而「Grace」CPU實際上也並非NVIDIA第一款以Arm架構打造的CPU產品，早在之前就已經推出多款Tegra處理器，甚至也曾應用在手機、機上盒等產品，只是後來考量競爭優勢與公司業務發展方向轉型，因此Tegra處理器後續便轉往自動化應用、車載平台設計發展為主。

▲早期推出的Tegra處理器就是以Arm架構設計

此次推出「Grace」CPU的用意，實際上是針對人工智慧與超算使用需求打造，其中又以打通GPU藉由CPU存取系統記憶體設計，藉此改善過往x86架構CPU受限PCIe頻寬情況，讓GPU處理大量運算資料時，可直接藉助系統記憶體資源大幅提高資料運算處理效率。

為了讓更多CPU資源可用於資料處理上，NVIDIA甚至在設計上整合旗下Bluefield DPU設計，以子系統形式協助處理原本由CPU執行的I/O埠控管、資料傳輸安全等需求，避免佔用CPU運算資源。

▲藉由Arm架構特性，可讓GPU直接存取系統記憶體資源 ▲在x86架構CPU受限PCIe傳輸頻寬情況下，GPU與CPU之間溝通效率明顯低了不少

NVLink技術無法突破的障礙

對NVIDIA持續關注的人應該會提出質疑，先前明明已經提出NVLink的技術，讓GPU之間可以透過串接共享更大顯示記憶體資源，甚至也能用於GPU與CPU之間溝通，但問題就在於顯示記憶體價格成本明顯比系統記憶體昂貴許多，而GPU與CPU之間藉由NVLink技術溝通，實際上也要看x86架構CPU業者是否願意與NVIDIA進行此方面合作。

例如，Intel本身就提出CXL開放架構推動伺服器超算能力，而AMD方面也提出智慧存取記憶體 (Smart Access Memory)技術，藉此消除受限PCIe頻寬的數據傳輸效率，藉此提高CPU與GPU之間溝通運算效能。

▲NVLink技術原本NVIDIA希望用於解決GPU記憶體資源取用問題

雖然過去IBM曾與NVIDIA合作，透過NVLink進行GPU與CPU之間溝通，藉此加快資料加速處理效率，但以整體超算伺服器市場仍以x86架構CPU主導情況來看，顯然僅與IBM合作依然不夠，因此藉由Arm架構打造「Grace」CPU，進而凸顯將Arm架構應用在人工智慧運算及超算領域確實有其發展機會，不僅能進一步推動Arm架構超算應用發展，同時也會吸引更多伺服器業者開始考慮投入Arm架構應用佈局，進而擴大Arm架構在智慧型手機、嵌入式應用以外市場發展。

「Grace」CPU對於NVIDIA至關重要

依照NVIDIAQ執行長黃仁勳在後續受訪時表示，推出「Grace」CPU的用意絕對不是為了取代原本合作許久的x86架構CPU，同時未來也沒有打算僅以Arm架構CPU投入發展，強調「Grace」CPU是為了補足現行x86架構CPU無法滿足的巨量數據傳輸處理效率需求。

而「Grace」CPU的設計，對於NVIDIA至關重要的原因，則是增加自有人工智慧、超算等級CPU產品製作能力，無須完全受限於Intel、AMD合作關係，在伺服器應用發展更是多了話語權，不再只是以GPU加速應用立場自居，更能提供完整人工智慧及超算伺服器設計應用方案。

此外，藉由Arm架構打造「Grace」CPU，並且持續與Arm合作讓後續推出的Armv9指令集也能對應CUDA及CUDA-X指令集，因此未來或許也能看見更多Arm架構CPU搭配NVIDIA GPU的組合應用，例如強調未來將使旗下Mac機種全數轉換為Arm架構處理器設計的蘋果，或許未來也有機會藉此恢復與NVIDIA合作。

關於「Grace」CPU的名稱

依照NVIDIA說明，「Grace」CPU最快會在2023年進入市場應用，預期會在2022年推出Ampere顯示架構下一款產品，以及Nluefield-3 DPU，此後將維持每年都會有新產品問世的更新頻率，並且以GPU、DPU與CPU產品交錯方式更新。

不過，相較過往產品都是以科學家的姓 (last name)作為代號，例如Fermi、Kepler、Maxwell、Pascal、Turing、Ampere，此次公布的「Grace」CPU，卻是以名 (first name)作為代號，或許NVIDIA計畫在鎖定超算領域的CPU產品將以科學家的名作為代號，而在Ampere顯示架構之後的代號，有可能就是先前傳聞許久的「Hopper」。