Google 利用 Gemma 技術打造語言模型 DolphinGemma,透過人工智慧解析海豚聲音,促進跨物種溝通研究。
Google宣布正在以Gemma模型技術為基礎,計畫打造能理解海豚聲音背後涵義的大型自然語言模型「DolphinGemma」,預計搭配名為「CHAT」 (Cetacean Hearing Augmentation Telemetry,鯨豚聽力增強遙測)系統,藉此與海豚進行對話,進而判斷是否能與海豚溝通。
目前已知海豚在不同行為活動時會發出不一樣的聲音,甚至能透過各種聲音判斷環境狀態,甚至也像人類般有社交行為,因此了解海豚發出聲音背後涵義,一直都是人類持續研究項目。
而此研究,則是野生海豚計畫 (Wild Dolphin Project,WDP)團隊與Google、美國喬治亞理工學院合作,透過其長年紀錄相同海豚族群的水下活動影片,藉由影片中的各類海豚發出聲音進行訓練,建立成參數規模約4億的「DolphinGemma」模型,預計搭配「CHAT」系統讓「DolphinGemma」模型嘗試產生正確的「海豚語」。
其中,「CHAT」系統是以Pixel 9手機本身算力運作,並且能以更具彈性方式測試,例如將Pixel 9手機固定特定設備內,並且用在海豚喜愛物品上,藉此觀察海豚與這些設備發出「海豚語」的互動行為。
若「海豚語」的研究順利推展,或許Google接下來也有機會擴展研究更多動物「語言」。