Google IO 2024:Google推出Ask with Video即時影像與語音搜尋方式,活用Gemini多模態特性理解影片與發問提供解答

2024.05.15 02:18AM

Google宣布將推出由Gemini驅動的Ask with Video即時影像與語音搜尋方式,Ask with Video是透過手機的視訊鏡頭拍攝即時影像結合麥克風收錄的自然語言的新搜尋方式,發揮Gemini多模態特性,針對即時影像逐幀分析與理解自然語言,提供不同於傳統文字敘述或以圖搜圖的新搜尋方式。

▲Ask with Video是Gemini多模態的應用,可一方面將即時影像逐幀拆解元素、理解自然語言發問並分析問題
▲透過理解唱臂可能的故障成因後提供可能的解決辦法,同時也在拍攝到產品品牌之餘提供產品官網

Google以一台唱臂故障的鐵三角黑膠唱機為例,透過手機拍攝唱臂故障的情形,並詢問該如何修復,Ask with Video利用辨識影片中唱臂的晃動狀況分析是哪種故障情況,除了提供故障排除的建議以外,還可透過影片拍到的裝置品牌,一併提供產品官網的連結。

相關消息

科技應用
EVOX《對話式 AI 白皮書》:掌握 AI 商務溝通新趨勢
癮特務
3 天前
即拍即印普普風概念印章,製造屬於自己的圖像
annti wang
15 年前
應用教學
國家鐵道博物館開館 6處古蹟、8大展覽必參觀 藍皮火車預約搭乘方法看這裡
Zero圈圈
23 個小時前
App
三星One UI 8以Android桌面模式取代DeX
Chevelle.fu
3 天前
汽車未來
全新改款 BMW iX 豪華純電旗艦休旅強勢上市!「THE NEW BMW iX」現場直擊,亮點分享一次了解!
癮特務
9 天前
開箱評測
2吋大螢幕、7.9mm羽量級厚度 Garmin Venu X1智慧手錶評測心得
Tandee
22 個小時前
《奇妙之旅》家族競技展開 熱鬪場內容介紹
皮耶哈
15 年前
快訊
伊良可樂台灣首店即將開幕!排不到可以試試這款糖漿,肥仔快樂水自己做。
Shopping guide
1 天前
文化創意
日本Sony宣布LinkBuds Fit與初音未來合作 限量500套加贈壓克力架與AR模型
Chevelle.fu
1 天前