Google 搜尋藉由 MUM 工具使搜尋不同語言資訊更便利,並以搜尋 COVID-19 疫苗相關資訊為例進行介紹

2021.06.30 01:10PM
照片中提到了Q Vacuna SinoVac、وزارتسأ حاقل、а Ковишилд,包含了圖、產品設計、產品、牌、組織

對許多人而言,除了透過社群分享的資訊以外,藉由 Google 搜尋相關新聞訊息也是常用的資訊獲取方式,而 Google 今天宣布一項應用於 Google 搜尋的工具,稱為  Multitask Unified Model (縮寫為 MUM ),並以當前 Google 搜尋相當熱門的 COVID-19 疫苗為例,簡單介紹 MUM 對於搜尋可帶來哪些幫助。

MUM 工具的重點,是能夠解決跨語言搜尋時各地對於相同物體或是事件有不同別稱、導致可能會缺乏特定語言相關資訊的問題;簡單的說,英文為 Soda 的汽水又可以稱為碳酸飲料或是肥宅快樂水,這三個稱呼實際上指的是相同一件事情,但對於傳統搜尋引擎則可能視為三個不同的事物,若搜尋 Soda ,則可能在台灣語系只會出現汽水相關資訊,如此一來碳酸飲料與肥宅快樂水的資訊就會被遺漏。

▲ MUM 本身建構在理解 75 種語言的學習與知識轉移,在理解同一事物的不同別稱後可統整所有資訊並搭配查核工具提供正確的資訊

MUM 是採用跨語言轉移知識的方式,可在 75 種語言進行學習與知識轉移,猶如一位能說 75 國語言的使用者在看完一本書以後能夠使用其它語言分享重點,不光只是把書本的內容進行翻譯;也因此,借助跨語言轉移知識的 MUM 使得 Google 搜尋不需要自每一種語言重新學習,透過遷移學習能夠快速獲得其它語言的相關資訊,僅需導入一小部分的各國別稱使 MUM 學習那些是同義詞。

以當前對 COVID-19 疫苗為例,包括 AstraZeneca 、CoronaVac 、 Moderna 、 Pfizer 、 Sputnik 等廣泛使用的疫苗在全世界共有超過 800 種、跨 50 種語言的別稱,使用者可能會以 Coronavaccin Pfizer 、 mRNA-1273 、CoVaccine 等別稱取代官方名稱,借助 MUM ,即可正確地把使用者搜尋的名稱與其它相同疫苗別稱的資訊整合,同時藉由可靠資訊辨識工具提供使用者正確且即時的資訊,避免有心人士利用別稱散布假消息後,導致使用該別稱搜尋疫苗資訊的大眾產生恐慌或是錯誤認知。

資料來源