NVIDIA 發表現代化 AI 工作伺服器設計 Dell、技嘉在內廠商產品獲認證

2021.01.27 09:08PM
照片中提到了ANNOUNCING NVIDIA-CERTIFIED SYSTEMS、Performance Optimized to Securely Run NVIDIA AI Stack At-Scale、DELLTechnologies,跟英偉達、超微有關,包含了多媒體、服務器、戴爾電腦、圖形處理單元

NVIDIA表示,在目前越來越多現代化應用服務都已經透過上雲形式呈現,因此伺服器端也必須要有足夠加速運算能力,以利支撐此類運算需求,同時也必須提供足夠網路傳輸吞吐頻寬,藉此讓人工運算應用可以更為敏捷、即時,並且符合使用者快速連接使用需求,甚至可對應更大運算規模使用模式。

強調由NVIDIA提供後續完整技術支援

藉由旗下GPU設計協助加速各類雲端伺服應用,同時也透過收購Mellanox使伺服器連網架構升級後,NVIDIA更進一步提出以Ampere顯示架構打造,針對現代化人工智慧工作流程設計的伺服器認證,並且公布首波取得認證廠商包含Dell、技嘉、HPE,以及浪潮 (inspur)與Supermicro。

在此之前,NVIDIA其實也曾針對人工智慧及機器學習應用提出NGC-Ready認證,而此次則是針對現代化人工智慧工作流程設計的伺服器提出認證,並且針對符合認證的伺服器產品提供完整軟體資源,藉此讓NVIDIA針對此類伺服器直接提供軟體技術資源。

不過,諸如管理端的作業系統、驅動程式,或是經NVIDIA認證的系統資源,依然會是由NVIDIA合作品牌提供。

而NVIDIA主要是針對CUDA、GPU驅動程式、網路設備驅動程式,以及相關控制軟體提供最佳化,其他包含NVIDIA GPU虛擬化軟體、TensorRT、Clara、Triton等人工智慧應用軟體,乃至於與TensorFlow、PyTorch等人工智慧演算框架串接,都可由NVIDIA提供相應資源,藉此讓透過伺服器推動加速的人工智慧運算效率提升。

在此次提出認證中,主要條件必須Ampere顯示架構的GPU進行加速,在連網部分則可讓OEM廠商選擇使用SmartNIC與DPU,或是使用InfiniBand與乙太網路交換器的設計,並未強制規範兩者必須同時兼具,而在網路傳輸速度部分也並非在NVIDIA提出認證規範內。

NVIDIA表示,在目前越來越多現代化應用服務都已經透過上雲形式呈現,因此伺服器端也必須要有足夠加速運算能力,以利支撐此類運算需求,同時也必須提供足夠網路傳輸吞吐頻寬,藉此讓人工運算應用可以更為敏捷、即時,並且符合使用者快速連接使用需求,甚至可對應更大運算規模使用模式。

通過NVIDIA認證的伺服器,標榜可在首次啟用時就能立即投入人工智慧領域相關運算應用,並且在機器學習或數據分析等運算確保其正確性。

0 則回應