聯發創新基地發表 MR Breeze‑ASR 25 ASR AI 語音辨識開源模型,強調能辨識台灣用語跟口音與中英文混雜語境。
聯發科旗下前瞻技術研發單位—聯發創新基地 (MediaTek Research),今日 (7/9)宣布正式推出全新語音辨識開源模型MR Breeze ASR 25,主打針對台灣常見用語與在地口音進行最佳化,並且在中英混用的語言情境下展現更高辨識準確度。此模型基於OpenAI Whisper開發,並且以Apache 2.0授權條款開源,將協助更多在地開發者及產業加速導入AI語音應用。
聯發創新基地負責人許大山博士表示,過去國際主流語音模型在面對台灣地區的中文語境時,仍存在「聽不懂台灣」的問題,例如將「發生什麼事」辨識成「花生什麼事」等常見錯誤。而MR Breeze ASR 25的誕生,即是為了「讓AI更懂台灣人說的話」。
根據官方數據,相較於OpenAI Whisper,MR Breeze ASR 25在本地語音辨識準確度提升近10%,針對台灣常見的中英混用語句 (Code-switching)表現更大幅提升56%。這不僅可應用於智慧客服、會議記錄轉錄、字幕生成等常見場景,也為未來地端部署與裝置端AI帶來更多可能性。
此次發表的MR Breeze ASR 25為MR Breeze系列的第二代語音辨識模型,屬於聯發創新基地推動「繁體中文AI全棧化」策略的一環。該單位已經在2025年陸續釋出具備視覺理解能力的多模態語言模型 (V-LLM)、專為台灣腔調整的TTS模型,以及支援外部函式呼叫的語言模型,全面打造本地化AI技術生態。
目前MR Breeze ASR 25已經透過HuggingFace上架,開發者與企業可自由下載使用。有興趣的開發者可前往聯發創新基地官方平台了解更多技術細節與應用案例,或是直接試用模型效能。
在全球語音AI技術競爭持續升溫之際,聯發創新基地透過強化在地語言理解與開源共享策略,展現其推動「台灣語言科技自主」的長期企圖與實踐力。