Gemini 2.5 Flash 開放開發者使用 可打造低延遲、高成本效益 AI 模型

2025.04.18 09:13PM

Google 推出 Gemini 2.5 Flash 版本供開發者使用,具備低延遲與高成本效益特色,有助於優化 AI 模型運算效率。

不久前在Google NEXT』25預覽更低延遲運作、成本效益更高的AI模型Gemini 2.5 Flash,目前已經開始向開發者提供測試

相比Gemini 2.5 Pro能處理前後達100萬個詞元內容理解處理,並且能進行深度資料分析、在特定專業領域提供關鍵見解,或是在理解整個程式碼後進行複雜編碼工作,成為Google當前能力最高的人工智慧模型,Gemini 2.5 Flash則是提供更低延遲執行效率,以及更低使用成本,預期成為多數應用服務主力使用模型,同時也能保持一定執行處理正確率表現,適合用於製作互動虛擬助理,或是即時內容摘要工具。

而Gemini 2.5 Flash同時具備動態、可控的推理能力,可依照提問內容複雜度自動調整處理時間 (可視為「思考預算」考量),針對可簡單回覆提問內容更快做出互動,同時開發者或企業也能設定使用成本,依照實際需求調整回應速度、準確率,藉此讓服務運作預算可更有效益地使用。

開發者可以透過Google AI Studio或Vertex AI平台調整Gemini 2.5 Flash「思考」時生成的詞元數量。若將詞元數量調整越低,其反應速度就會越快,反之則會以更多時間進行「思考」,而背後反應成本也會相對較高。

至於在Gemini 2.5 Flash的知識量,目前截至今年1月擷取內容,並且同樣支援文字、圖片、影片、音訊多模態輸入,但結果僅能輸出文字內容,同時定位上將取代原本的Gemini 2.0 Flash Thinking。

相關消息

科技應用
EVOX《對話式 AI 白皮書》:掌握 AI 商務溝通新趨勢
癮特務
2 天前
即拍即印普普風概念印章,製造屬於自己的圖像
annti wang
15 年前
App
三星One UI 8以Android桌面模式取代DeX
Chevelle.fu
3 天前
《奇妙之旅》家族競技展開 熱鬪場內容介紹
皮耶哈
15 年前
汽車未來
全新改款 BMW iX 豪華純電旗艦休旅強勢上市!「THE NEW BMW iX」現場直擊,亮點分享一次了解!
癮特務
9 天前
應用教學
國家鐵道博物館開館 6處古蹟、8大展覽必參觀 藍皮火車預約搭乘方法看這裡
Zero圈圈
17 個小時前
快訊
伊良可樂台灣首店即將開幕!排不到可以試試這款糖漿,肥仔快樂水自己做。
Shopping guide
1 天前
文化創意
日本Sony宣布LinkBuds Fit與初音未來合作 限量500套加贈壓克力架與AR模型
Chevelle.fu
1 天前
開箱評測
2吋大螢幕、7.9mm羽量級厚度 Garmin Venu X1智慧手錶評測心得
Tandee
16 個小時前