GTC 2023 ： NVIDIA 公布著重低能耗的 NVIDIA L4 Tensor Core GPU 以及針對大型語言模型佈署的 NVIDIA H100 NVL 加速模組，迎接 AI 的「 iPhone 時代」 #Grace Hopper SuperChip (190879)

NVIDIA 宣布擴大採用新世代架構的推論產品新陣容，在 GTC 2023 公布針對基礎設施與低功耗的 NVIDIA L4 GPU ，以及針對大型語言模型佈署、採用高相容性 PCIe 介面的 NVIDIA H100 NVL 模組。在這兩項推論新品加入陣容後，與先前已經公布的 NVIDIA L40 GPU 、 Grace Hopper Superchip 構成基於新世代架構的推論產品線。 NVIDIA 希冀藉由更廣泛且彈性的加速運算系統，迎接 AI 的「 iPhone 時代」(註：指 AI 將迎來如 iPhone 帶動智慧手機一樣的時期)。

NVIDIA Grace Hopper Superchip 與 NVIDIA H100 NVL GPU 預計在 2023 年下半年推出， NVIDIA L4 與 NVIDIA L40 兩款加速產品已陸續由合作夥伴與雲服務商開始提供；其中 NVIDIA L4 GPU 可透過 Google Cloud Platform 開放非公開預覽。

▲ NVIDIA L4 著重於影像處理，強調一台具倍 8 張 L4 的伺服器具倍等同百台雙 CPU 插槽的伺服器

NVIDIA L4 是著重節能與高效率的推論產品，適用於邊際運算基礎設施領域、尤其針對影像處理，採用易於安裝的單槽 Low-Profile 設計， NVIDIA 強調 NVIDIA L4 相較前一代同級產品提升 4 倍圖形效能與 2.7 倍 AI 效能，對比 CPU 具備 120 倍的 AI 影像效能與提升 99% 的能源效率，並具備支援任何可使用通用 GPU 的工作負載，並具備增強影像編碼、轉碼、擴增實境與生成式 AI 影像。

▲ NVIDIA H100 NVL 模組式將兩張 H100 以 NVLink 進行連接，但仍採用伺服器系統主流的 PCIe 介面與 CPU 溝通

▲ H100 NVL 相較 A100 在執行 Chat-GPT 更具效能與成本效益

NVIDIA H100 NVL 則是鎖定佈署大型語言模型( LLM )的市場需求，例如大型 ChatGPT 模型，借助 NVLink 將兩張 NVIDIA H100 進行連接，再以 PCIe 與 CPU 系統連接，等同提供 94GB 的單卡記憶體，相較資料中心級的 NVIDIA A100 ，借助新架構與支援 Transformer Engine ，可在 GPT-3 推論提升 12 倍效能。

至於 NVIDIA L40 則是針對圖形與支援 AI 的 2D 、影片與 3D 等內容生成 AI 的重要產品，也是第三代 OVX 圖型運算系統的關鍵組件，作為執行 NVIDIA Omniverse 進行數位孿生，相較上一代產品提升 7 倍推論性能與 12 倍的 Omniverse 效能。

而基於 NVIDIA Grace Hopper Superchip 則能為推薦模型提供出色的效能，借助高達 900GB/s 頻寬的 NVLink-C2C 使 CPU 與 GPU 能高速溝通，相較使用 PCIe Gen 5 串接的 Grace CPU 與 Hopper GPU ， Grace Hopper Superchip 具備 7 倍的溝通頻寬。

Chevelle.fu

猜你喜歡

Chevelle.fu

相關消息