Mozilla 開源語音辨識引擎專案「同聲計畫」已累積 7226 小時語音資料對應包含中文等 54 種語言 (154799)

照片中提到了Common Voice、moz://a，跟新山之都有關，包含了普通語音Mozilla、共同的聲音、Mozilla基金會、Mozilla、語音識別

同聲計畫中貢獻最多的語音資料，分別為英文、德文、法文、義大利文與西班牙文，但實際上也包含中文在內亞洲語言，同時也包含不少小眾語言。

此次同時也推出針對特定單字的聲音內容

Mozilla從2017年7月開始推動的開源語音辨識引擎專案同聲計畫 (Common Voice)，目前在最新語音資料庫內收錄長達7226小時的語音內容，其中更包含增加14種小眾語言，使得收錄語言數量增加至54種。

就同聲計畫本身立場來看，希望透過收錄大量語言聲音資料，藉此讓語音識別為主的技術有更大開放性與包容性，讓全球更多小眾語言也能像主流語言一樣被重視，並且使小眾語言主要使用者也能透過熟悉交談方式使用新技術。

另一方面，同聲計畫收錄語音內容也能應用在各類語音識別應用技術訓練，例如Mozilla旗下語音轉文字引擎DeepSpeech，便是藉由同聲計畫收錄語音內容進行訓練，同時也能識別不同年齡層、性別，以及各地區口音所呈現語言內容。

目前在收錄長達7226小時的語音內容的資料庫中，總計累積550萬個語音內容片段，平均長度為4.7秒，其中總計長達5591小時長度內容已經透過Mozilla社群確認為有效資料。而在同聲計畫中貢獻最多的語音資料，分別為英文、德文、法文、義大利文與西班牙文，但實際上也包含中文在內亞洲語言，同時也包含不少小眾語言。

除了同聲計畫募集聲音內容，Mozilla現在更提供針對特定情況使用的單字聲音內容，其中蒐集包含數字發音，或是喚醒等用途的特定關鍵字發音內容，總收錄內容長度達120小時，分別由1萬1000人在一個月內以18種語言建立。

Tagged Common Voice, Mozilla, 同聲計畫

資料來源

https://mashdigi.com/mozilla-common-voice-added-more-voice-d...

Mash Yang

此次同時也推出針對特定單字的聲音內容

資料來源

Mash Yang

相關消息