OpenAI 推出 Voice Engine 技術 15 秒音檔即可生成擬真語音

2024.04.02 10:14AM

OpenAI 推出 Voice Engine 技術,僅需 15 秒音檔即可生成自然合成語音,並可應用於協助病患保留聲音、跨語言溝通等用途。

日前推出可透過文字、靜態圖像生成長達1分鐘擬真影片的自動生成式人工智慧技術「Sora」之後,OpenAI稍早再次宣布推出以15秒長度聲音範本即可生成自然合成語音的Voice Engine技術。

不過,為了避免產生爭議,OpenAI目前並未對外開放使用Voice Engine技術,僅針對特定用途如協助因病逐漸喪失語言能力的病患保留其聲音,同時所有以此技術產生內容都會加上可追蹤來源的數位浮水印,避免有心人士濫用此技術。

而透過Voice Engine技術生成的合成語音,幾乎與本人發出聲音相仿,甚至也能讓合成語音轉以其他語言陳述,讓使用者能以自己聲音與國外對象溝通,而非透過其他合成語音對談。

類似技術,其實先前已經有不少業者提出,但通常需要長度更長的原始語音資料進行學習,因此OpenAI標榜僅需15秒長度即可完成學習訓練,並且生成貼近本人語音聲調內容,顯然是在做技術上的火力展示。

目前OpenAI僅先向特定企業提供此技術進行測試,並且透過反饋意見改善使用體驗與安全問題。包含線上教育公司Age of Learning、敘事視覺化平台HeyGen、健康資訊軟體商Dimagi、AI通訊App開發商Livox,以及健康系統商Lifespan都已經開始使用OpenAI此技術打造應用服務。

相關消息

遊戲天堂
NVIDIA DLSS 310.3.0將DLSS 4的VRAM使用量再減20%
Chevelle.fu
6 天前
關於android播放3gp內含AAC無法撥放問題
hanawa
15 年前
人物專訪
GPS導航發明前計程車怎麼找路?以前載客常遇到霸王車、靈異事件?本篇就讓「老司機」親自說給你聽!
丹費特
1 個月前
新奇搞笑
貨幣博物館「裝滿百萬美元的展示箱」被認真魔人破解其實超裝55萬
Twelve
1 天前
蘋果新聞
《F1》電影將破 3 億美元全球票房 成蘋果史上最高收益電影
Mash Yang
6 個小時前
開箱評測
不僅僅是防曬 體感溫度也能大幅降低 Uniqlo遮陽傘 傘面還能旋轉卸力
Gizmodo Japan
2 天前
達梭系統收購搜尋應用平台公司 Exalead
news.tw
15 年前
新奇搞笑
路面高溫熱到「爆」 車輛經過當場示範飛車特技
Twelve
1 天前
HP引領資料中心結構、伺服器延展性和應用程式自動化的新潮流
news.tw
15 年前