科技應用 OpenAI 開源模型 OpenAI 全新開源 AI 模型最快今夏推出 將採更寬鬆開源授權 OpenAI 傳將於今年夏季推出新開放原始碼 AI 模型,採更寬鬆授權條款,促進更多開發者使用。 OpenAI先前透露將在今年內接續推出新款開源人工智慧語言模型消息後,目前有更多關於此款模型的消息透露。 相關消息指稱此模型由OpenAI研究副總裁Aidan Clark主導研發,但現階段仍處於早期階段,最快可能會在今年夏季對外公布。而此款模型計畫在開源模型中可達頂尖運算能力表現,定位為推論模型,類似OpenAI當前的o系列模型。 同時,OpenAI可能會在此模型採更寬鬆的開源使用授權許可,藉此與DeepSeek等中國提出開源模型競爭,對比Meta的Llama、Google的Gemma雖然都是以開 Mash Yang 7 天前
科技應用 Google Gemma Gemma 2 開源模型 Google 開放開源模型 Gemma 2 效能超越 Llama 3 Google Gemma 2開源模型優化 TPU、GPU 加速,提供 270 億參數高效能版本及 90 億參數小規模版本,學術研究者可透過 Colab、Kaggle 免費取用。 Google在今年Google I/O 2024期間宣布推出全新開源模型Gemma 2,本身針對TPU、GPU加速最佳化,並且能輸出2倍高的模型運行效能,最多更可對應270億組參數,但同時也提供可對應90億組參數的小規模版本,接下來也會提供更小規模設計的26億組參數版本,將可在手機端執行。 在稍早說明中,Gemma 2可透過數據建模與數據分析競賽平台Kaggle取得,或是透過全名為Colaboratory的網頁編寫程式 Mash Yang 10 個月前
科技應用 Stability AI 開源模型 Stable Audio Open Stability AI 推出 Stable Audio Open 開源模型 文字生成 47 秒音效 Stable Audio Open 開源模型能以文字描述生成約 47 秒聲音內容,模型是以超過 48 萬筆合法聲音紀錄訓練,適用於環境音效及內容創作。 Stability AI宣布釋出能以文字描述自動生成聲音內容的Stable Audio開源版本,並且以Stable Audio Open為稱,將可依照文字內容生成約47秒長度聲音內容。 Stable Audio Open模型是以超過48萬筆聲音紀錄進行訓練,其中超過90%資料源自免費聲音資料庫Freesound,同時也有部分聲音源自Free Music Archive (FMA),並且強調所有聲音內容都事先合法取得使用許可。 至於文字內容理解部 Mash Yang 10 個月前
產業消息 GEMINI 生成式AI Vertex AI Gemini 1.5 視覺語言 開源模型 Google IO 2024:Vertex AI推出具成本因素與低延遲的Gemini 1.5 Flash與針對視覺的PaliGemma Google Cloud的Vertex AI託管開發平台宣布即日起推出Gemini 1.5的新分支Gemini 1.5 Lite的預覽版,是專為成本因素以及著重低延遲的任務形式的版本,另外還有Gemma開放模型家族當中首個視覺語言模型PailGemma。 Gemini 1.5 Lite可視為Gemini 1.5 Pro的延伸版本,具備相同的100萬個Token,但鎖定如聊天應用程式、字幕、影像與圖片分析、從長文章擷取關鍵內容與數據等成本與延遲應用;另外在2024年4月提供公開預覽版的Gemini 1.5 Pro也將在6月正式推出。 ▲PaliGemma是Gemma開源模型當中首個針對視覺語言應 Chevelle.fu 11 個月前