開源模型全攻略 (157865) - Cool3c

最新 | 熱門

OpenAI 全新開源 AI 模型最快今夏推出將採更寬鬆開源授權

OpenAI 傳將於今年夏季推出新開放原始碼 AI 模型，採更寬鬆授權條款，促進更多開發者使用。 OpenAI先前透露將在今年內接續推出新款開源人工智慧語言模型消息後，目前有更多關於此款模型的消息透露。相關消息指稱此模型由OpenAI研究副總裁Aidan Clark主導研發，但現階段仍處於早期階段，最快可能會在今年夏季對外公布。而此款模型計畫在開源模型中可達頂尖運算能力表現，定位為推論模型，類似OpenAI當前的o系列模型。同時，OpenAI可能會在此模型採更寬鬆的開源使用授權許可，藉此與DeepSeek等中國提出開源模型競爭，對比Meta的Llama、Google的Gemma雖然都是以開

Mash Yang

照片中提到了> Gemma 2，跟谷歌有關，包含了谷歌阿斯特拉項目、Google I / O、人工智能、谷歌鏡頭

Google 開放開源模型 Gemma 2 效能超越 Llama 3

Google Gemma 2開源模型優化 TPU、GPU 加速，提供 270 億參數高效能版本及 90 億參數小規模版本，學術研究者可透過 Colab、Kaggle 免費取用。 Google在今年Google I/O 2024期間宣布推出全新開源模型Gemma 2，本身針對TPU、GPU加速最佳化，並且能輸出2倍高的模型運行效能，最多更可對應270億組參數，但同時也提供可對應90億組參數的小規模版本，接下來也會提供更小規模設計的26億組參數版本，將可在手機端執行。在稍早說明中，Gemma 2可透過數據建模與數據分析競賽平台Kaggle取得，或是透過全名為Colaboratory的網頁編寫程式

Mash Yang

Stability AI 推出 Stable Audio Open 開源模型文字生成 47 秒音效

Stable Audio Open 開源模型能以文字描述生成約 47 秒聲音內容，模型是以超過 48 萬筆合法聲音紀錄訓練，適用於環境音效及內容創作。 Stability AI宣布釋出能以文字描述自動生成聲音內容的Stable Audio開源版本，並且以Stable Audio Open為稱，將可依照文字內容生成約47秒長度聲音內容。 Stable Audio Open模型是以超過48萬筆聲音紀錄進行訓練，其中超過90%資料源自免費聲音資料庫Freesound，同時也有部分聲音源自Free Music Archive (FMA)，並且強調所有聲音內容都事先合法取得使用許可。至於文字內容理解部

Mash Yang

照片中提到了Gemini 1.5、Pro、Flash，跟谷歌有關，包含了平板顯示器、平板顯示器、文本、儀表

Google IO 2024：Vertex AI推出具成本因素與低延遲的Gemini 1.5 Flash與針對視覺的PaliGemma

Google Cloud的Vertex AI託管開發平台宣布即日起推出Gemini 1.5的新分支Gemini 1.5 Lite的預覽版，是專為成本因素以及著重低延遲的任務形式的版本，另外還有Gemma開放模型家族當中首個視覺語言模型PailGemma。 Gemini 1.5 Lite可視為Gemini 1.5 Pro的延伸版本，具備相同的100萬個Token，但鎖定如聊天應用程式、字幕、影像與圖片分析、從長文章擷取關鍵內容與數據等成本與延遲應用；另外在2024年4月提供公開預覽版的Gemini 1.5 Pro也將在6月正式推出。 ▲PaliGemma是Gemma開源模型當中首個針對視覺語言應

Chevelle.fu

相關文章