NVIDIA 的實驗性 GPU RC 18 披露未來有意轉向模組化封裝 GPU 取代現行單一 GPU 設計

2019.04.08 04:50PM
Graphics Cards & Video Adapters, Graphics processing unit, Multi-chip module, , Nvidia, Integrated Circuits & Chips, Single Chip Module, GeForce, Die, Multi-GPU, nvidia multi chip gpu, Text, Line, Font, Diagram, Parallel

根據日本媒體 Impress Watch 資深記者後藤弘茂在今年 NVIDIA GTC 的報導, NVIDIA 在今年 GTC 大會介紹了一款名為 RC 18 研究用晶片,雖然這類晶片離商用化或許不是那麼近,但其架構設計往往可視為未來發展的可能性,這顆 RC 18 晶片傳達了一項訊息: NVIDIA 未來可能會朝向在單一封裝中使用多個模組化 GPU ,取代現行以單一大型 GPU 晶片的作法。

根據此次的設計研究, NVIDIA 的想法是利用模組化 GPU 封裝的設計,使得 GPU 的性能變的更具彈性,當前的實驗也融合多個概念,除了在單一封裝上搭載最多 4 個 GPU 模組外,亦利用當前 NVLink 的概念,將多個 GPU 封裝利用高效率、高頻寬的光纖網路在單一電路上相互連接,使其性能能夠持續擴展。

當然這樣的架構轉移,也會使得 GPU 封裝設計變的複雜,未來單一個 IC 封裝上除了 GPU 與記憶體模組,還需要用於管理多個 GPU 與 I/O 的模組,不過不同於當前 PC 上的多 GPU 連接, NVIDIA 的架構概念更像是把現行藉由 NVLink 的多 GPU 設計變成在單一顆 IC 封裝上實現,使多個 GPU 可共享記憶體與通道。

值得注意的是, RC 18 是一款用於深度學習的實驗性加速器晶片,每個 GPU 模組上有 16 個 PE (深度學習用的處理單元),同時也因為模組化概念設計與實驗性質, RC 18 上的 GPU 模組並不大, RC 18 的 GPU 模組在台積電 16nm 下僅有 8,700 萬個電晶體,即便連接四個也只有 3.48 億個電晶體,甚至比 RTX 2060 的 TU-106 的 10.8 億個電晶體還少,然而這畢竟是實驗性質, RC18 最終的目的是在測試多 GPU 封裝之間各個模組能否順利的進行協作,以及可擴充性的深度學習架構,還有一項重要的指標是 RC 18 所採用的晶片互聯技術 GRS ( Ground Reference Signal )也將做為未來 NVIDIA 的 GPU 內部網路技術。

Document, Angle, Line, diagram, Text, Font, Line, Number

RC 18 還有一項值得注意的地方,即是在整個晶片當中使用了基於 RISC-V 的 Rocket CPU 架構, Rocket 是與 Arm Cortex-A5 近似等級的 CPU 架構,然而除了晶圓所需面積更小以外,還有採用 64 位元指令集的優點, RC 18 將 Rocket 作為管理整個晶片的 PE 控制、 PE 的暫存記憶體、 PE 記憶體共享等管理相關功能。

雖說 RC 18 只是用於技術與概念研究的晶片,本身也是偏向深度學習應用,不過許多的技術與想法都相當有機會做為未來 GPU 的設計理念。

關於 RC 18 還有不少資訊,若有興趣可前往原文連結看更詳盡的報導。

新聞與圖片來源: PC.Watch