NVIDIA Blackwell再度於MLPerf Training展現壓倒性性能，強調也是唯一提交所有V5.0測試項的平台 #大型語言模型 (240564)

隨著基於NVIDIA Blackwell架構的系統陸續上線，NVIDIA與合作夥伴再度於新一輪的MLPerf提交測試結果，並呈現全面且壓倒性的領先優勢，這也是自2018年MLPerf基準測試推出後的第12輪測試，而NVIDIA在每一輪皆繳出最大規模效能，此次也實現在最新一版MLPerf v5.0基準測試繳交所有測試成果、包括Llama 3.1 405B預訓練的所有成果，是唯一提交所有MLPerf v5.0基準測試結果的平台，展現在大型語言模型、推薦系統、多模態大型語言模型、物體偵測與圖神經網路(GNN)的全面性。

NVIDIA此次大規模遞交的測試結果為使用兩部搭載NVIDIA Blackwell平台的AI超級電腦，包括使用Arm架構驅動的NVIDIA GB200 NVL72機架系統的Tyche，以及使用x86架構驅動的NVIDIA DGX B200構成的Nyx；此外NVIDIA也與CoreWeave及IBM合作，提交以2,396個Blackwell GPU與1,248個Grace CPU構成的GB200 NVL72的測試成績。

▲GB300 NVL72展現系統級整合的全方位設計，使效能較前一代相同GPU數量的系統顯著提升

於最新的Llama 3.1 405B預訓練基準，Blackwell架構的效能相對上一代Hopper架構高出2.2倍；而在Llama 2 70B LoRA微調基準測試，基於8個Blackwell GPU的NVIDIA DGX B200系統效能較使用同數量GPU的Hopper系統高出2.5倍。

▲NVIDIA的效能突破並不僅止於GPU技術，還包括網路連接、軟體生態系的持續創新

這些測試結果不僅顯現Blackwell架構上的突破，同時還輔以高密度液冷機架、以及每個機架配有高達13.4TB的統一記憶體、可用於垂直拓展的NVIDIA NVLink、NVLink Switch互連技術，以及NVIDIA Quantum-2 InfiniBand等整合，還有如NVIDIA NeMo Framework軟體堆疊帶來的創新，使其具備驅動下一代多模態大型語言模型訓練的基礎，並展望將代理型AI推向市場應用的可能，展現NVIDIA不僅只是提供GPU加速硬體，更提供系統、互聯網路、軟體及生態系的全方位優勢。

Chevelle.fu

猜你喜歡

Chevelle.fu

相關消息