產業消息 廣告 nvidia AI 醫療 語意分析 機器視覺 TensorRT NVIDIA Ampere BERT NVIDIA 發表能縮減一半語言推論時間的 TensorRT 8 AI 套件,能提升對話式 AI 、推薦系統效益 NVIDIA 宣布新一代的 AI 軟體套件 TensorRT 8 ,強調能夠使語言推論時間縮減一半,對於應用在搜尋引擎、廣告推薦、聊天機器人等帶來顯著的效益。TensorRT 8 針對語言相關應用進行最佳化,可在 1.2ms 執行龐大的 BERT-Large ,不須屈就性能縮減模型規模導致準確率下降。 ▲藉由 Ampere 的結構化稀疏技術、量化感知訓練使 TensorRT 8 具更高的推論性能 TensorRT 8 得以大幅提升推論性能,除了軟體持續精進以外,更重要的是發揮 Ampere 架構兩項關鍵技術,其一是藉由結構化稀疏減少運算操作並提高效率,另一項關鍵是能夠以 INT8 精度執行卻不 Chevelle.fu 1 年前
產業消息 nvidia AI Turing TensorRT 藉 Turing 架構與 TensorRT 軟體支援掀起服務業的 AI 革新, NVIDIA 推出 Tesla T4 加速器 NVIDIA 的 Tesla V100 加速器的 Volta 架構憑藉 CUDA Core 與 RT Core ,在科學運算、超級運算與大規模 AI 推論引發革命,以更少的體積、更少的能耗發揮更強的運算力,而新一代的 Turing 圖靈 GPU 架構也延續 Volta 整合 RT Core 的特性,為新一代的 GPU 挹注 AI 能力,在接連推出針對繪圖的 Quadro RTX 以及消費娛樂的 GeForce RTX 20 GPU 後, NVIDIA 也基於 Turing 圖靈 GPU 架構發表 Tesla T4 加速器,鎖定服務業對於包括語音、影像與圖像等領域對 AI 的迫切需求,搭配全新的 Chevelle.fu 4 年前