Mozilla「同聲計畫」開始收錄更多語言 用於協助聲音的「平等發展」

2018.06.08 01:25PM
143
是Mozilla「同聲計畫」開始收錄更多語言 用於協助聲音的「平等發展」這篇文章的首圖
首圖

去年7月啟用「同聲計畫 (Common Voice)」收錄大量英語聲音檔,藉此讓語音識別在內服務能以此訓練更準確判斷效果後,Mozilla稍早在宣布將於「同聲計畫」內加入收錄德語、法語、威爾斯語聲音內容,未來更計畫收錄包含繁體中文在內超過40種語言。

為了讓語音識別在內服務有更正確判斷效果,Mozilla稍早宣布將使「同聲計畫」加入德語、法語、威爾斯語在內聲音內容,未來更準備加入包含繁體中文、西班牙文、印尼文和俄文在內超過40種普及語言,其中更包含菲士蘭語 (Frysian)、挪威語、楚瓦什語 (Chuvash)在內小眾語言,讓這些相對較少人使用的語言也能被應用在語音識別、翻譯,或是其他聲控相關應用服務,進而縮減這些小眾語言在網路等科技應用發展所處弱勢情況。

以深度學習的角度來看,若是提供學習學習的參考範本充裕,將能讓深度學習效果更加顯著,因此以目前英語文本、聲音資料充裕的線上服務來看,幾乎都是對英語為主的使用者有利,尤其在聲音資料內容部分,目前網路流通數據依然是以英語為大宗,因此許多數位助理服務多半都會支援英語,相對以中文、日文或韓文在內語言為主的數位助理服務幾乎為少數。

因此,Mozilla決定在去年7月宣布啟用「同聲計畫」透過收錄大量語言聲音資料,藉此讓語音識別為主的技術有更大開放性與包容性,讓全球更多小眾語言也能像主流語言一樣被重視,並且使小種語言主要使用者也能透過熟悉交談方式使用新技術。

而除了收錄一般主流被使用語言,「同聲計畫」收錄內容更包含各地方言,藉由各地區願意提供聲音的捐助者進行內容閱讀且完成錄音,藉此讓不同語言能更有系統地以數位化行留存,對於少數語言保留也有相當大的意義。

回應 0
科技應用
一圖看懂 林口新創園「一站式服務」
討喜小姐 陳薪智
7 個小時前
科技應用
懶科技:一次解密5家新創園區特點懶人包
陳薪智
7 個小時前
科技應用
Pixel 3拆解後顯示 螢幕採用LG OLED顯示面板
Mash Yang
18 個小時前

熱門文章

最新消息

本日精選