OpenAI 推出通用型 ChatGPT 代理,從資料分析、旅遊規劃到程式執行皆能勝任。
OpenAI宣布推出具備通用操作能力的ChatGPT Agent代理功能,讓AI服務能從單純回答問題,轉變為真正能代替使用者「完成任務」的代理型工具。
目前這項新功能先開放給 ChatGPTPro、Plus與Team訂閱用戶使用,或許後續也會以有限制形式提供一般免費用戶使用。
這款新登場的代理功能具備自動瀏覽行事曆、生成簡報、撰寫投影片,甚至直接在內建終端機運行程式碼的能力,並且整合OpenAI近期幾項重要技術成果,包括不久前推出具備點擊與網頁互動能力的Operator,以及能彙整資料產出完整報告的Deep Research。
自然語言輸入即可操作多項複雜任務
使用方式相當簡單,使用者只需在ChatGPT工具選單中開啟Agent模式,即可進入ChatGPT Agent介面,並且透過自然語言輸入指令,即可觸發如「規劃預訂一趟美國旅程」、「採購製作日式早餐的食材」、「分析三家競爭對手,並且製作簡報」等高複雜度操作。其背後可結合多種Connector (連接器),串接諸如Gmail、GitHub等服務,或是透過API呼叫外部應用服務,藉此執行更進階的工作流程。
而在此波更新中,OpenAI更宣布將於30天後讓Operator功能退役,但Deep Research模組仍將以獨立選項保留,提供需要更深入研究的場景應用。
測試成績顯示顯著領先
根據OpenAI公布的測試數據,ChatGPT Agent代理功能在多項AI測試中均有亮眼表現,其中Humanity’s Last Exam (pass@1)達41.6%,約為o3與o4-mini表現的2倍;而FrontierMath則達27.4%,明顯高於o4-mini的6.3%。這也顯示ChatGPT Agent代理功能不只是AI語言模型運作,而是具備推理與執行能力的多工AI工具。
高度重視安全與使用者控管
隨著代理型AI工具逐漸進入主流市場,OpenAI也明確表示其ChatGPT Agent代理功能在設計上極度重視安全控管,舉凡像是預訂行程、填寫表單或與涉及個資的網站互動,都會事前請求使用者明確授權。
此外,OpenAI更引入「監視模式」 (supervised mode),要求使用者在高風險任務執行過程中,逐步核准每個行動指令。而當面對金融交易、法律諮詢等敏感內容時,ChatGPT Agent代理功能則會主動拒絕執行。
通用型Agent是通往AI工作助理願景的重要一步
目前市面上雖已有多款AI代理工具問世,但大多在應對複雜任務時仍顯不足。OpenAI則強調,ChatGPT Agent代理功能以其最強基礎模型與成熟整合框架支撐運作,是目前市場上最具競爭力的通用代理型AI工具,將ChatGPT的應用層次從過往回應型,進一步躍升至真正的「執行型AI」。