LINE 與母公司 NAVER 合作打造超巨大規模日語語言模型 擁超過100億頁資料量 可加速日本 AI 服務發展

2020.11.25 06:23PM
照片中提到了国立大学兰 京工、大学イノベーション創出論、木村,跟薩拉勞倫斯學院、密蘇里銀行有關,包含了自助書、微笑曲線、物理學家、數學、矩陣力學

LINE此項超巨大語言模型涵蓋超過1750億種參數變因、總計超過100億頁的日語資料量,目前已經能以相當自然形式詮釋日語內容,並且可完成自然對話等應用,希望藉此推廣更多以日語為基礎的人工智慧應用服務,並且加速更多日本境內人工智慧應用體驗。

跟市場普遍以英語語言模型為主的情況競爭

稍早於日本舉辦的LINE Developer Day 2020活動中,LINE宣布與NAVER共同針對日語應用需求打造超巨大語言模型,藉由人工智慧處理運算呈現自然語言表現效果,並且能對應各類服務應用需求。

依照LINE說明,此項超巨大語言模型涵蓋超過1750億種參數變因、總計超過100億頁的日語資料量,相較現存以日語為主的語言模型更為龐大,同時日後也會持續擴展收錄資料量。

之所以建立此項超巨大日語語言模型,是因為目前市場同樣規模的語言模型多半是以英語為主,例如OpenAI提出的GPT系列語言模型,或是Google打造的T5語言模型,都是以目前全球最常使用的英語為基礎,此次宣布建構超具大規模的日語語言模型,便是希望推動更多以日語為主的自然語言應用服務,並且透過API方式讓更多服務可以直接串接使用,無須額外進行事先訓練。

由於此項語言模型已經先由LINE進行建構、訓練,因此已經能以相當自然形式詮釋日語內容,並且可完成自然對話等應用,希望藉此推廣更多以日語為基礎的人工智慧應用服務,並且加速更多日本境內人工智慧應用體驗。

而在此項超巨大日語語言模型背後,將透過運算量達700PFLOPS的超級電腦運作,預期可在未來一年內投入商業應用。

0 則回應