Facebook 在理解不同語言、文化背景下 以五大原則打擊仇恨言論

2021.06.04 01:43AM
照片中提到了JUNINH,包含了學生、棕色的頭髮、長發、頭髮、棕色

目前Facebook在全球約有35000人負責內容安全事務,同時也有15000人負責內容審查,同時絕大多數內容都會在24小時內完成審查。從2019年12月至2020年12月間,Facebook對於仇恨言論處理量便增加389%,其中透過機器主動偵測、過濾比例則達97.1%,使得每一萬則發文內容僅有7-8則包含仇恨言論,搭配使用者檢舉及內容過濾審核,即可大幅消除Facebook內的仇恨言論比重。

配合人工智慧、在地團隊、檢舉機制等管道減少攻擊發言

針對Facebook平台上的仇恨言論情況,Facebook負責仇恨言論內容政策經理Manu Gummi表示會基於蒐集意見、確保真實性、安全、保護隱私及尊嚴五大原則,並且配合位於各地區內容政策團隊成員討論及反饋意見作為參考,同時藉由人工智慧等技術預先識別絕大多數的仇恨言論內容,另外也會採納使用者申訴內容,藉此讓Facebook不會淪為變成攻擊他人的平台。

Manu Gummi說明,Facebook對於仇恨言論內容採取相當完整的應對作法,其中包含制定完整社群使用守則,並且清楚告知使用者在Facebook服務平台應遵守事項,同時也會透過位於全球各地區的內容政策團隊成員討論內容及意見,藉此了解各地區對於仇恨言論的理解與看法,藉此調整適合各地區的規範作法。

藉由各地內容政策團隊了解在地語言及文化差異

不過,語言及文化上的差異,其實也讓處理仇恨言論內容面臨相當大的挑戰,因為其中涉及不同語言對於相同內容陳述方式會有差異,加上文化差異上的影響,都會讓仇恨言論定義有明顯落差,因此並非只是透過字面上的直覺陳述作判斷,因此Facebook必須在全球各地區建制內容政策團隊,希望透過了解在地語言、文化的成員可以更具體反應哪些內容,或是什麼樣的情況會讓人不舒服。

另一方面,由於Facebook上每天增加難以計算的發文數量,單純透過人力審核內容幾乎是不可能的任務,因此勢必要透過機器識別方式輔助。但機器畢竟難以像人類般思考,因此在不同語言上如何清楚識別個別字句涵義也變得重要。

透過三級別評斷仇恨言論嚴重性

依照Facebook內部設定不同評級,將仇恨言論內容區分成三大級別,其中第一級基本上就包含明顯暴力言論,以及形容他人為動物、昆蟲等污衊行為,或是抹滅人性情況,甚至興起仇恨言語行為,而第二級則涵蓋以生理、道德等缺陷貶低他人,或是咒罵及表示輕蔑、憎恨等情況,至於第三級就涵蓋涉及號召產生排擠、隔離行為,同時也包含更嚴重的毀謗及詆毀情況,而Facebook會針對不同及別的仇恨言論調整處理方式。

但Manu Gummi也強調如先前提及即使是相同字句,在不同情況下會有不同「涵義」,例如發文內容提及「去市場指定買台灣豬」,實際上是在台灣地區反萊豬的環境背景所產生言論,實際上並非詆毀台灣或台灣人,而諸如「你的預約號碼是426」,實際上也並非指許多仇恨中國人的台灣人所使用「426」字眼。

配合人工審核、申訴等方式降低「誤殺」情況

因此,如果要避免在內容審核發生「誤殺」,就必須在基本使用守則制定清楚規範,並且配合理解不同語言、文化背景差異下的詮釋及理解落差,藉此讓人工智慧系統及機器學習機制可以用更快效率清理各類仇恨言論,再搭配使用者舉報等方式補強機器未能處理內容。

而為了避免機器產生誤判,Facebook依然會有內容審查團隊確認發文是否違反仇恨言論規範,同時也能配合檢舉申訴機制降低未能正確處理仇恨言論發文情況。

消弭仇恨言論是相當大的挑戰

目前Facebook在全球約有35000人負責內容安全事務,同時也有15000人負責內容審查,同時絕大多數內容都會在24小時內完成審查。從2019年12月至2020年12月間,Facebook對於仇恨言論處理量便增加389%,其中透過機器主動偵測、過濾比例則達97.1%,使得每一萬則發文內容僅有7-8則包含仇恨言論,搭配使用者檢舉及內容過濾審核,即可大幅消除Facebook內的仇恨言論比重。

只是隨著在Facebook分享傳遞內容越來越多元,Manu Gummi也表示讓內容審核變得越來越有挑戰性,因此如何讓人工智慧能持續在不同語言使用情境下正確識別仇恨言論,甚至可以檢視整篇文字內容、圖像或影片表徵內容,藉此讓機器更容易在成千上萬筆發文內容揪出違反仇恨言論內容。

26 則回應

你可能有興趣的文章