推論加速器全攻略 (140891) - Cool3c

最新 | 熱門

GTC 2025：NVIDIA針對工作站、伺服器推出NVIDIA Blackwell RTX PRO GPU，提供資料中心、桌上型與筆電三種組態、最高96GB GDDR7配置

繼AI加速運算與消費級GeForce產品後，NVIDIA於GTC 2025宣布推出NVIDIA Blackwell RTX PRO產品線，提供資料中心、桌上型與筆記型電腦三種型態的GPU，其中伺服器與桌上型GPU產品最大記憶體配置達96GB，筆電GPU最大達24GB，可提供加速運算、AI推論、光線追蹤與神經渲染等應用，附帶一提的是RTX PRO產品定位可視同過往的Tesla與Quadro產品線的整合，聚焦視覺化、模擬與科學運算三大應用類型。 NVIDIA Blackwell RTX PRO於資料中心GPU提供NVIDIA RTX PRO 6000 Blackwell伺服器版本，桌上型電腦GPU

Chevelle.fu

GTC 2025：NVIDIA公布NVIDIA Dynamo開源推論模型架構，透過分散式運算可協調並加速數千個GPU的推論通訊

NVIDIA在GTC 2025不僅公布Blackwell Ultra加速運算GPU，還宣布對於當前資料加速運算產業相當重要的開源AI推論服務軟體NVIDIA Dynamo；NVIDIA Dynamo是作為協調與加速數千個的GPU的推論通訊，利用分散式運算特性於大型語言模型的處理與產生分配到不同的GPU，可針對特定需求單獨將每個階段最佳化；NVIDIA Dynamo不僅完全開源，還支援包括PyTorch、SGLang、NVIDIA TensorRT-LLM和 vLLM，企業、新創與研究人員可使用熱門的AI框架進行部署，同時實現分散式推論，可提升AI工廠(AI Factory)服務的性能、縮減回應

Chevelle.fu

Intel於GDC遊戲開發者大會釋出XeSS 2 SDK協助遊戲導入相關技術，攜手微軟使Arc GPU提升10倍神經紋理壓縮推論性能

Intel在GDC 2025宣布幾項與Arc GPU息息相關的進展，其中在2024年末公布第二世代Arc獨立顯示卡Arc B580與Arc B570時所宣布的XeSS 2將於2025年3月18日在GitHub釋出SDK工具，使開發者能在遊戲導入XeSS 2一系列AI增強功能；同時Intel與微軟合作展示DirectX Cooperative Vectors，使Arc架構的XMX AI引擎在執行神經紋理壓縮的推論效能提高10倍。微軟正式將基於AI的新一代圖像增強XeSS 2 SDK釋出，使開發者可將XeSS 2包含的XeSS-SR(超解析)、XeSS-FG(幀生成)、XeLL(低延遲)等技術結

Chevelle.fu

高通攜手IBM自邊際至雲端布局企業級生成式AI解決方案

▲高通攜手IBM協助企業在雲端與邊際部屬混合模式的生成式AI 高通宣布與IBM擴大合作，推動雲端與邊際裝置的企業級生成式AI解決方案；雙方計畫將IBM watsonx.governance整合至Qualcomm AI推論套件，並使其能在高通高效能、低功耗的邊際裝置執行，使企業能在其規模負責任的管理AI，同時Quaslcomm AI Hub將提供經過最佳化的IBM Granite 3.1模型，此外Qualcomm Cloud AI系列加速器獲得Red Hat OpenShift認證，協助企業實現真正的混合雲部署。高通延續在CES公告的合作，高通與IBM將在Snapdragon 8 Elite參

Chevelle.fu

照片中提到了A、AMPERE One、Qualcomm，跟高通公司、安培計算有關，包含了電子產品、電子產品、微控制器

Ampere攜手高通推出Arm CPU結合推論加速器解決方案，希冀降低產業對GPU的依賴

當前AI硬體產業幾乎處在NVIDIA喊水會結凍的GPU加速時代，許多晶片商預測短時間難以在具備完整生態系與硬體技術領先的模型訓練與高通正面對抗，紛紛把AI技術目標放在邊際設備的AI推論應用；採用Arm指令集自研伺服器晶片的Ampere宣布與高通合作，將旗下處理器與高通Qualcomm Cloud AI 100 Ultra平台結合，旨在提供更具能源效益且減少對GPU依賴的解決方案。 ▲Qualcomm Cloud AI 100 Ultra鎖定推論應用，結合高度能源效率的Ampere處理器能提供一套節能推論系統 Ampere希冀透過與高通的技術聯手，能夠提供更低能耗且高效能的AI推論平台，並顛覆低

Chevelle.fu

照片中提到了Elevate Play with Unrivaled XSS AI Acceleration、IA380E-QUFL、intel.，包含了傳單、LED背光液晶屏、液晶顯示器、發光二極管、背光燈

安提國際推出基於Intel Arc A380E的IA380E-QUFL邊際AI加速卡，採半高單插槽設計

由於AI於各領域的廣泛應用，許多著重即時性的邊際設備如電信網路、安全監控裝置等也紛紛透過邊際AI加速卡方式實現AI功能；安提國際(Aetina)於德國紐倫堡Embedded World 2024公布採用Intel Arc A380E的IA380E-QUFL，採用半高單插槽PCIe子卡設計，能安裝於緊湊的裝置，並提供5年長期供貨，適用於商用遊戲、電視牆、醫療影像、基於AI推論的機器視覺應用。 ▲Arc A380E具備8個Xe Core與6GB GDDR6 IA380E-QUFL具備6GB GDDR6記憶體，強調不僅尺寸小巧，且僅使用50W能耗(註：Intel官方簡報為75W，也許是由於半高卡設計

Chevelle.fu

照片中提到了OT、ASTRA、synoptics，包含了屏幕截圖、突觸、突觸、嵌入式系統、嵌入式世界

Synaptics發表基於SL系列嵌入式處理器與開發套件的Astra AI原生物聯網平台

Synaptics於Embedded World 2024大會期間宣布包含SL系列嵌入式處理器與Machina Foundation系列開發套件在內的Astra AI原生物聯網平台，藉此滿足產業對AI的全面需求；Astra AI平台提供滿足當前產業需求的架構、擴充性與靈活性，提供開箱即用的邊際AI體驗，SL處理器允許設計人員不需依賴雲端資料中心即可將AI導入產品、藉此解決隱私與延遲問題。Synaptics將擴大AI原生產品，於後續推出針對能耗最佳化的AI原生SR系列MCU。 Astra AI原生物聯網平台包括硬體、整合軟體、自適應開源AI框架、合作夥伴生態系與無線連接，能為物聯網邊際裝置設計提

Chevelle.fu

照片中提到了CIVICIA、VIDIA、VIDIA，包含了黑暗、英偉達、圖形處理單元、英偉達、集成電路

NVIDIA Hopper架構TensorRT-LLM使生成式AI推論提升近3倍，H200藉HBM3e記憶體散熱打破MLPerf推論紀錄

雖然NVIDIA甫在GTC 2024公布眾所矚目的全新Blackwell架構，但畢竟Blackwell仍要待到2024年下半年才會開始出貨，故目前最新的NVIDIA AI GPU加速產品為採用美光HBM3e記憶體的NVIDIA H200 Tensor Core GPU；NVIDIA公布全新的MLPerf測試成績，基於Hopper架構的H100借助TensorRT-LLM軟體突破MLPerf的生成式AI測試項突破原本的性能上限，於GPT-J LLM推論性能較6個月前提升近3倍，而陸續出貨的H200 GPU則透過容量、頻寬提升的HBM3e記憶體與更彈性的散熱，一舉刷新多項MLPerf的紀錄。 ▲包

Chevelle.fu

美光8層堆疊24GB HBM3e記憶體正式量產，NVIDIA H200 Tensor Core GPU率先採用

美光Micron宣布兼具高效能、大容量且更節能的HBM3e記憶體已正式量產，同時NVIDIA H200 Tensor Core GPU為首款宣布採用美光8層堆疊的24GB HBM3e解決方案的產品，並於2024年第二季出貨。同時美光預計於2024年3月還將推出12層堆疊36GB HBM3e記憶體樣品，並成為NVIDIA GTC大會贊助夥伴，屆時將分享更多美光AI記憶體產品組合與藍圖。 ▲於2023年11月公布的NVIDIA H200 Tensor Core GPU將是美光HBM3e的先行導入產品 HBM記憶體是當前高效能運算、AI應用、資料中心等不可或缺的記憶體技術，美光新一代HBM3e記憶體

Chevelle.fu

照片中提到了Qualcomm、Cloud Al 100 Ultra、MWL，跟高通公司、澳大利亞博物館有關，包含了個人電腦硬件、電腦硬件、電腦、電腦數據存儲、戴爾技術

高通鎖定生成式AI、大型語言模型公布Qualcomm Cloud AI 100 Ultra雲端AI推論加速器

雖然高通Qualcomm在當今的AI大戰的重心放在擅長的邊際裝置側，不過在SC23活動期間，高通公布了一款可程式化的雲端AI推論加速器新品Qualcomm Cloud AI 100 Ultra，作為因應當前生成式AI與大型語言模型(LLM)世代的需求，強調較前一代產品性能提升4倍，並可透過Qualcomm AI Stack 和Cloud AI SDK連接多個Qualcomm Cloud AI 100 Ultra擴大推論能力。 ▲Qualcomm Cloud AI 100 Ultra是一款鎖定推論使用的加速卡 Qualcomm Cloud AI 100 Ultra是一款具可程式化特質的AI加速器

Chevelle.fu

相關文章