Mozilla 開源語音辨識引擎專案「同聲計畫」已累積 7226 小時語音資料 對應包含中文等 54 種語言

2020.07.07 01:10AM
94
照片中提到了Common Voice、moz://a,跟新山之都有關,包含了普通語音Mozilla、共同的聲音、Mozilla基金會、Mozilla、語音識別

同聲計畫中貢獻最多的語音資料,分別為英文、德文、法文、義大利文與西班牙文,但實際上也包含中文在內亞洲語言,同時也包含不少小眾語言。

首圖

此次同時也推出針對特定單字的聲音內容

Mozilla從2017年7月開始推動的開源語音辨識引擎專案同聲計畫 (Common Voice),目前在最新語音資料庫內收錄長達7226小時的語音內容,其中更包含增加14種小眾語言,使得收錄語言數量增加至54種。

resize 螢幕快照 2018 06 08 上午10.14.01 Mozilla的同聲計畫已經累積7226小時語音資料,總計對應54種語言

就同聲計畫本身立場來看,希望透過收錄大量語言聲音資料,藉此讓語音識別為主的技術有更大開放性與包容性,讓全球更多小眾語言也能像主流語言一樣被重視,並且使小眾語言主要使用者也能透過熟悉交談方式使用新技術。

另一方面,同聲計畫收錄語音內容也能應用在各類語音識別應用技術訓練,例如Mozilla旗下語音轉文字引擎DeepSpeech,便是藉由同聲計畫收錄語音內容進行訓練,同時也能識別不同年齡層、性別,以及各地區口音所呈現語言內容。

目前在收錄長達7226小時的語音內容的資料庫中,總計累積550萬個語音內容片段,平均長度為4.7秒,其中總計長達5591小時長度內容已經透過Mozilla社群確認為有效資料。而在同聲計畫中貢獻最多的語音資料,分別為英文、德文、法文、義大利文與西班牙文,但實際上也包含中文在內亞洲語言,同時也包含不少小眾語言。

除了同聲計畫募集聲音內容,Mozilla現在更提供針對特定情況使用的單字聲音內容,其中蒐集包含數字發音,或是喚醒等用途的特定關鍵字發音內容,總收錄內容長度達120小時,分別由1萬1000人在一個月內以18種語言建立。

Tagged Common Voice, Mozilla, 同聲計畫

0 則回應