DeepMind 打造會自主學習的人工智慧 MuZero 有助自駕車、機器人面對新的未知狀況

2020.12.25 12:26AM
照片中包含了零、零、走、將木、深心

DeepMind在MuZero技術採用不同作法,而是讓人工智慧可依照當前蒐集資訊進行分析學習,藉此縮短在變動條件環境運算所需時間,其中包含當前決策價值、最佳運算決策,以及前一個決策執行成果,藉此進行反覆學習,進而從中學習最佳規則執行決策能力。

可在更短時間熟悉未知規則運算模式

Alphabet旗下人工智慧技術公司DeepMind,宣布推出名為MuZero的人工智慧系統,標榜在完全不了解規則情況下,即可快速熟悉圍棋、西洋棋、將棋,或是57款Atari電子遊戲遊玩規則,並且取得更好遊玩表現。

依照DeepMind說明,MuZero的技術背後,代表可藉由人工智慧技術也覺日常生活中複雜規則,或是事前無法確知規則的難題。

相比現有DQN、R2D2或Agent57人工智慧技術,MuZero能以更快效率找出既有規則,並且快速解決問題。而MuZero的技術更代表能讓人工智慧有規劃思考能力,並且利用現有條件統整規則,即便面臨全新運算場景也能快速找出問題解決方式。

過去研究人員分別透過預先搜尋 (lookahead search),以及基於現有運算模型規劃能力,讓人工智慧能針對未知規則情況進行運算,但由於既有運算方式仍仰賴前期規則訓練,因此必須花費更多時間才能順利找出全新運算環境對應規則,因此並不適合用於解決未知條件的運算需求,同時也難以解決條件相對複雜的運算情境。

因此DeepMind在MuZero技術採用不同作法,而是讓人工智慧可依照當前蒐集資訊進行分析學習,藉此縮短在變動條件環境運算所需時間,其中包含當前決策價值、最佳運算決策,以及前一個決策執行成果,藉此進行反覆學習,進而從中學習最佳規則執行決策能力。

在這樣的運算模型執行下,將可讓MuZero人工智慧技術在圍棋、西洋棋、將棋,或是57款Atari電子遊戲更快發揮執行效果,甚至在棋藝能力比擬AlphaZero,並且在Atari電子遊戲執行成果更勝現有人工智慧技術。

同時,若允許MuZero以更長時間進行「思考」,其在棋藝表現會有更顯著下子正確率,並且呈現更精湛的進攻方式,甚至可在電子遊戲內容有更高學習效率。

未來DeepMind團隊預計利用MuZero技術解決更多人工智慧前期學習與分析未知解法問題,預期未來也能讓更多機器人、自駕車等經常處於未知判斷條件的運算需求,能在更短時間內找到合適執行方式。

0 則回應