NVIDIA Blackwell再度於MLPerf Training展現壓倒性性能,強調也是唯一提交所有V5.0測試項的平台

2025.06.05 12:57PM

隨著基於NVIDIA Blackwell架構的系統陸續上線,NVIDIA與合作夥伴再度於新一輪的MLPerf提交測試結果,並呈現全面且壓倒性的領先優勢,這也是自2018年MLPerf基準測試推出後的第12輪測試,而NVIDIA在每一輪皆繳出最大規模效能,此次也實現在最新一版MLPerf v5.0基準測試繳交所有測試成果、包括Llama 3.1 405B預訓練的所有成果,是唯一提交所有MLPerf v5.0基準測試結果的平台,展現在大型語言模型、推薦系統、多模態大型語言模型、物體偵測與圖神經網路(GNN)的全面性。

▲NVIDIA也繳交基於x86平台的DGX B200測試結果

NVIDIA此次大規模遞交的測試結果為使用兩部搭載NVIDIA Blackwell平台的AI超級電腦,包括使用Arm架構驅動的NVIDIA GB200 NVL72機架系統的Tyche,以及使用x86架構驅動的NVIDIA DGX B200構成的Nyx;此外NVIDIA也與CoreWeave及IBM合作,提交以2,396個Blackwell GPU與1,248個Grace CPU構成的GB200 NVL72的測試成績。

▲GB300 NVL72展現系統級整合的全方位設計,使效能較前一代相同GPU數量的系統顯著提升

於最新的Llama 3.1 405B預訓練基準,Blackwell架構的效能相對上一代Hopper架構高出2.2倍;而在Llama 2 70B LoRA微調基準測試,基於8個Blackwell GPU的NVIDIA DGX B200系統效能較使用同數量GPU的Hopper系統高出2.5倍。

▲NVIDIA的效能突破並不僅止於GPU技術,還包括網路連接、軟體生態系的持續創新

這些測試結果不僅顯現Blackwell架構上的突破,同時還輔以高密度液冷機架、以及每個機架配有高達13.4TB的統一記憶體、可用於垂直拓展的NVIDIA NVLink、NVLink Switch互連技術,以及NVIDIA Quantum-2 InfiniBand等整合,還有如NVIDIA NeMo Framework軟體堆疊帶來的創新,使其具備驅動下一代多模態大型語言模型訓練的基礎,並展望將代理型AI推向市場應用的可能,展現NVIDIA不僅只是提供GPU加速硬體,更提供系統、互聯網路、軟體及生態系的全方位優勢。