繼蘋果率先在A18系列應用處理器與M4系列處理器的Armv9指令集架構CPU導入SME2可擴展矩陣延伸指令集2後,Arm宣布在即將推出的Android手機的應用處理器也同樣將支援SME2;Arm強調新一代Android旗艦晶片借助導入SME2,將進一步擴展AI應用的可能,可在AI異構運算框架支援包括影像處理、自然語言處理、語音生成等裝置端的即時推論。
可預期,與Arm合作密切的聯發科,以及已經與Arm結束授權官司的高通,有望分別在天璣9500及Snapdragon 8 Elite Gen 2支援SME2,至於Google的Tensor G5就是個未知數了。
Arm強調SME2是基於SME的升級,也是Armv9架構當中的一組高階CPU指令集,受惠於Arm KleidiAI,行動開發者不須更動現有程式碼、模型或應用程式,即可使SME2無縫整合至Runtime函式庫與AI框架中。同時由於iOS環境也已經支援SME2,SME2也為Arm生態系提供可移植的解決方案,當前已有900萬款應用於Arm運算平台執行,並有超過2,200萬名開發者正在基於Arm平台建構應用與工作負載。

當前SME2已於Google為Android系統最佳化的神經網路推論函式庫XNNPACK提供支援,一旦搭載支援SME2指令集處理器的裝置推出並啟用時,XNNPACK可自動透過KleidiAI將矩陣運算密集任務導引至SME2,不須進行任何應用邏輯或架構變更即可獲得性能提升;另外SME2亦已整合至阿里巴巴MNN、Google LiteRT 和 MediaPipe、 微軟 ONNX Runtime 以及 llama.cpp當中,也同樣可無縫提升性能與體驗。
Arm強調在搭載SME2的硬體執行Google Gemma 3模型時,聊天互動的AI回應速度相對未啟用SME2的速度快6倍,即便僅使用單CPU核心,Gemma 3也能在不到一秒啟動達800字的文本摘要;也由於SME2大幅提升AI性能,已有一家領先的ISV承諾將應用中的大部分token(詞元)自雲端遷徙自行動端,有一部分也是受惠行動裝置AI能力的持續突破。
除了既有Android AI應用開發者能無縫受惠外,Arm也公布開發者啟動平台,協助行動開發者充分運用SME2優勢,並以豐富案例示範如何針對KleidiAI強化框架進行開發,進而預設啟動硬體層的新一代加速運算能力。