亞馬遜推出 Nova Sonic 模型 深層理解人類對話 能捕捉語氣與音調

2025.04.10 12:58PM

Amazon 發表新款 Nova Sonic 模型,能深入理解人類對話,捕捉語調與語氣,提升人機溝通體驗,預計廣泛應用於客服領域。

亞馬遜宣布推出全新基礎模型Amazon Nova Sonic,將語音理解與語音生成統一於單一的模型中,使人工智慧應用服務的語音對話表現更貼近真人,並且透過Amazon Bedrock以API形式呼叫使用,可用於服務通話自動化服務,或是涵蓋旅遊、教育、醫療、娛樂等領域的跨產業人工智慧代理服務。

傳統語音應用開發需要同時協調多個模型,例如將語音轉為文字的語音識別模型,搭配理解且生成回應的大型語言模型,以及再將文字轉為音訊呈現的文本轉語音模型,不僅增加開發的複雜性,同時也難以保留自然對話中至關重要的聲音情境和細微差別,如語氣、語調韻律和說話風格等等。

而Nova Sonic則是捨棄過往使用多個不同模型的設計,將理解與生成功能統一於單一模型中,讓模型能根據語氣、風格等聲音情境,以及口語輸入調整生成的語音回應表現更貼近自然對話語調。

Nova Sonic甚至能理解人類對話的細微變化,包括說話者的自然停頓與猶豫,能在恰當時機做出回應,並能從容應對對話中的插話情況。此模型同時會將語音內容生成文字檔,讓開發者能夠利用這些文本來調用特定工具與API,進而建構更豐富的語音人工智慧代理服務。

透過以下連結,可以感受透過Nova Sonic生成自然語調表現:

AI agent for travel built on Amazon Nova Sonic

Enterprise AI assistant built on Amazon Nova Sonic

相關消息

科技應用
EVOX《對話式 AI 白皮書》:掌握 AI 商務溝通新趨勢
癮特務
3 天前
即拍即印普普風概念印章,製造屬於自己的圖像
annti wang
15 年前
開箱評測
被評價為「每步都非常舒服」的恢復型拖鞋 2種熱賣的日常款比較
Gizmodo Japan
1 天前
文化創意
國家鐵道博物館第一階段開放 免費展區即有豐富內容、柴電工廠吸收新知
Chevelle.fu
18 個小時前
汽車未來
全新改款 BMW iX 豪華純電旗艦休旅強勢上市!「THE NEW BMW iX」現場直擊,亮點分享一次了解!
癮特務
10 天前
開箱評測
這麼薄卻可6裝置充電、總輸出達130W 這款Anker充電器規格簡直是拼命了
Gizmodo Japan
19 個小時前
開箱評測
可以與行李箱組合的三合一背包 我無法割捨Patagonia的理由
Gizmodo Japan
18 個小時前
產業消息
聯發科2025Q2手機營收佔52%預期旗艦天璣年內創造30億美金營收 首款2nm晶片維持9月設計定案
Chevelle.fu
1 天前
《奇妙之旅》家族競技展開 熱鬪場內容介紹
皮耶哈
15 年前