產業消息 NVIDIA GTC gpu 分散式運算 推論加速器 大型語言模型 NVIDIA Dynamo AI工廠 GTC 2025:NVIDIA公布NVIDIA Dynamo開源推論模型架構,透過分散式運算可協調並加速數千個GPU的推論通訊 NVIDIA在GTC 2025不僅公布Blackwell Ultra加速運算GPU,還宣布對於當前資料加速運算產業相當重要的開源AI推論服務軟體NVIDIA Dynamo;NVIDIA Dynamo是作為協調與加速數千個的GPU的推論通訊,利用分散式運算特性於大型語言模型的處理與產生分配到不同的GPU,可針對特定需求單獨將每個階段最佳化;NVIDIA Dynamo不僅完全開源,還支援包括PyTorch、SGLang、NVIDIA TensorRT-LLM和 vLLM,企業、新創與研究人員可使用熱門的AI框架進行部署,同時實現分散式推論,可提升AI工廠(AI Factory)服務的性能、縮減回應 Chevelle.fu 1 個月前