Google IO 2022:不用再講「Hey Google」 下指令只要看著它或是直接下指令

by Tandee
2022.05.12 02:18AM
照片中提到了show plumbers near me、10:38、An icon will appearon the top left corner of the screen to let you know Google Assistant is activated.,包含了動畫片、人的、產品、產品設計、人類行為

使用Google助理時,都要先講個「Ok Google」或是「Hey Google」叫醒它才能開始下指令。未來你可以不用這麼麻煩,Google新推出2種指令方式,可以完全捨棄呼叫詞。第一種方式是Look and Talk,只要注視著裝置像是在對它說話,它就能接收你的命令。另一種則是特定的命令詞,Google助理只要聽到這些指令,就算沒有呼叫詞也會執行命令。

注視它 Google就知道你要命令它

我們對於下命令總有些尷尬,未來對數位助理下指令或許可以更像是跟人類對話。目前Look and Talk功能已經在美國上線,將先應用於Google Nest Hub Max上。利用內建的偵測功能,裝置能感受到你的眼神正在注視它,此時會接收你即將說的命令句。當然這也不是這麼簡單,該如何判斷是匆匆一瞥還是真的想下指令,這些都需要大量的學習、偵測、運算。Google一共用了6個機器學習模型,處理從相機鏡頭及麥克風蒐集超過100個訊號,例如鄰近感應距離、頭部轉動角度、凝視方向、脈絡感知、意圖分類等,並據此即時判斷該執行的命令。

第二種命令方式則是更簡單暴力,Google直接列出數種可以直接執行的快速指令,像是開房間電燈、設定倒數計時器等。如果你選擇這種指令方式,可以先設定有哪些指令是可以免呼叫詞觸發,避免發生一些意外狀況。而且這些指令必須搭配Voice Match,辨識是特定用戶的聲紋才能執行。

照片中提到了Nest Hub Max、Look and Talk、12:00 •72,包含了Google Nest Hub Max、Google Nest Hub Max、Google Nest Hub、Google Nest Hub(第二代)、Google Nest Audio

▲看著它,它就知道你要下指令,接著只要說話就可以而不需要下指令詞。

你與數位助理對話可以更自然 就算停頓也沒關係

此外,你應該都有經驗下指令的時候稍微停頓,Google助理就聽不懂你的命令,或是執行錯誤的指令。人類講話時經常會出現語助詞或是停頓,Google打造全新的語音及語言模型,掌握人類語音的微妙細節,例如辨識什麼時候是暫停說話,而非說完話了。Google 助理將更能理解人類語音的不完整,不會因為停頓、嗯和被打斷而出錯,讓使用者互動起來的感覺,更接近自然對話。

照片中提到了Play the new song、frommmmm..、mm hm,包含了圖形、商標、產品、產品設計、字形

▲人類說話經常會有語助詞或是停頓,未來AI能辨識出這些頓點。

12 則回應

你可能有興趣的文章