NVIDIA團隊釋出NVLM 1.9多模態大型語言模型,視覺語言媲美GPT-4o、Llama 3-V 40.5B、InternVL 2抗衡
NVIDIA研究團隊重磅釋出NVLM 1.0開源多模態大型語言模型,最大版本NVLM-D-72B達720億參數(72B),開發團隊聲稱其視覺語言精確度媲美業界領先的GPT-4o私有模型以及Llama 3-V 40.5B、InternVL 2等開源模型,在舉出的例子甚至還包括理解迷因圖;不過NVLM 1.0旨在強化AI產業的發展,僅供作為研究,不允許商業使用。 ▲以執行長黃仁勳的照片為例展現出色的指令追蹤能力,並為圖片提供高品質且詳盡的描述 ▲甚至可以理解迷因圖背後想表達的意涵 NVIDIA研究團隊表示NVLM 1.0可在視覺語言與純文字的項目與領先的大型語言模型相當,甚至在OCRBench 和
9 個月前
蘋果開源 DCLM 模型 抗衡 Mistral、Llama 3 等競爭對手
蘋果釋出兩組小規模開源人工智慧模型,分別對應 69 億組及 14 億組參數,強調能與 Mistral、Llama 3、Gemma 等競爭對手抗衡。 蘋果機器學習研究團隊科學家Vaishaal Shankar稍早於「X」表示,分別釋出兩組小規模的開源人工智慧模型,均隸屬於「DCLM」 (DataComp for Language Models)發展項目,分別對應69億組參數及14億組參數,強調能與Mistral AI的70億組參數規模人工智慧模型,以及Meta提出的Llama 3、Google的Gemma、阿里雲的開源模型Qwen2直接抗衡。 同時,Vaishaal Shankar更標榜「DCL
1 年前
台智雲FFM-Llama3-70B首度在繁體中文表現超越GPT 4.0,FFM-Llama-8B整體評分也超越GPT-3.5
台智雲宣布推出FFM-Llama3-70B與FFM-Llama3-8B兩款針對繁體中文強化的大型語言模型(LLM),還有AFS ModelSpace模型API服務,並已上架雲端服務;其中FFM-Llama3-70B也是首次在繁體中文表現超越GPT 4.0的繁體中文大型語言模型,而FFM-Llama3-8B則與FFM-Matral-8x7B、FFM-Mistral-7B、FFM-Llama2-v2等台智雲其它大型語言模型整體評分超越GPT 3.5。 ▲台智雲最新釋出FFM-Llama3-70B在繁體中文有超越GPT-4的表現,其它繁體中文最佳化模型整體評價也優於GPT-3.5 台智雲一系列針對繁
1 年前
亞馬遜AWS宣布於Amazon SageMaker JumpStart提供Meta Llama 3基礎模型,能進行部署與推論
亞馬遜AWS宣布於Amazon SageMaker JumpStart平台提供Meta Llama 3大型語言模型(LLM),客戶能夠透過Amazon SageMaker JumpStart進行Llama 3的部署與推論。Amazon SageMaker JumpStart將與Meta同步提供8B與70B參數模型,兩款模型的上下文長度皆為8k,能廣泛支援推論、程式碼生成與指令跟隨,後續將隨Meta釋出的時程提供更多參數的版本。 包括美東(北維吉尼亞州)、美東(俄亥俄州)、美西(奧勒岡州)、歐洲(愛爾蘭)和亞太(東京)等區域的客戶現在可以在Amazon SageMaker Studio中透過點擊
1 年前
高通宣布旗艦Snapdragon裝置可支援Meta Llama 3 大型語言模型,手機、電腦、沉浸裝置到車載平台皆可受益
高通宣布Snapdragon平台將在高通與Meta協力下獲得Meta Llama 3模型的最佳化推論能力,包括智慧手機、個人電腦、VR/AR甚至車載平台皆可支援Llama 3推論,同時即將推出的Snapdragon旗艦平台獲得深度的推論最佳化;同時高通強調開發者能透過Qualcomm AI Hub的資源與工具快速於Snapdragon裝置部署與執行Llama 3模型,進而縮減應用推出時程並獲得最佳的推論執行效果。 ▲高通透過與Meta深度合作,助OEM與開發者流暢的在Snapdragon裝置執行Llama 3相關應用 高通與Meta的合作將協助OEM與開發者能在即將推出的旗艦Snapdrago
1 年前
NVIDIA宣布全面針對Meta Llama 3推論提供最佳化,透過雲端、邊際與個人電腦的NVIDIA GPU皆可執行
在Meta宣布釋出全新大型語言模型Llama 3的同時,相關產業領域的合作夥伴也紛紛宣布支援Llama 3,其中作為Meta自行持有的超級電腦的技術供應商的NVIDIA當然也在第一時間宣布消息;NVIDIA強調採用NVIDIA技術所建構的Meta Llama 3獲得NVIDIA GPU加速挹注,能夠自雲端與資料中心至邊際與個人電腦的NVIDIA GPU以最佳化的方式進行推論,且自即日起即可使用。 NVIDIA同步於ai.nvidia.com提供開發者以NVIDIA NIM微服務嘗試Llama 3:ai.nvidia.com ▲Meta工程師在24,576個NVIDIA H100 GPU叢集完成
1 年前
Meta推出功能更強大的開源大型語言模型Meta Llama 3,率先釋出8B與70B兩種參數版本、預計推出400B以上參數模型
Meta宣布推出新一代開放大型語言模型Meta Llama 3,強調是目前功能最強大的開放式大型語言模型,初步先釋出8B參數(現行較常見應該是7B參數)與70B參數兩個版本,更大參數規模的模型仍在訓練與驗證,並後續預計釋出最大超過400B參數的版本;Meta強調Llama 3創下多項產業指標紀錄,提供更精確的推論能力,同時支援多語言、多語態以及提供更長的上下文語境,同時也秉持開放創新將提供給社群使用,透過Llama 3為基礎建立專屬內容。 Llama 3 模型預計將可於 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Mi
1 年前
Meta 導入 Llama 3 大型自然語言模型 AI 數位助理反應更快、功能更強大
Meta 將於 5 月推出 Llama 3,並將其整合至全新的 Meta AI 平台,支援 Facebook、Messenger、WhatsApp 及 Instagram 等服務。 先前證實將在5月推出新一代開源使用的大型自然語言模型Llama 3,同時預計先推出小規模版本,藉此吸引開發者、企業測試使用,Meta宣布在其新版人工智慧數位助理平台Meta AI導入Llama 3,並且可用於旗下Facebook、Messenger、Whatsapp,以及Instagram服務平台,讓使用者能直接使用。 同時,Meta也宣布Meta AI平台將進駐美國以外多個國家地區,包含澳洲、加拿大、迦納、牙買加
1 年前
Meta 5 月推出新一代大型自然語言模型 Llama 3
Meta Llama 3 包含多種運算能力與不同型態模型,預計將快速佈署應用在 Meta 旗下服務產品,將先提供小規模版本供開發者和企業測試使用。 Meta證實,將於5月以開源形式推出新一代大型自然語言模型Llama 3,同時預計先推出小規模版本,藉此吸引開發者、企業測試使用。 由於近期越來越多人工智慧技術業者接連加快大型自然語言模型競爭,包含Google持續更新其Gemini大型自然語言模型,X日前也對外推出其大型自然語言模型Grok,而OpenAI也著手打造旗下一款大型自然語言GPT-5,因此也讓Meta加快其大型自然語言模型更新速度。 在此之前,消息指稱Meta計畫推出Llama 3大型
1 年前
Meta 7 月將推出新版大型自然語言模型 Llama 3 對決 OpenAI GPT-4
Meta大型自然語言模型Llama 3也將對應超過 1400 億組參數,並放寬安全限制,讓使用者能更進一步互動。 The Information網站引述消息指稱,Meta計畫在今年7月推出新版Llama 3大型自然語言模型,預計與OpenAI提出的GPT-4競爭。 不過,目前Meta尚未對此語言模型進行微調 (fine tune),因此尚未確認Llama 3是否對應多模型態運作,但預期可對應超過1400億組參數,相較Llama 2對應700億組參數有更大規模表現。 由於先前Llama 2加入安全護欄設計,因此無法回覆被認定具有爭議的提問,而Meta顯然計畫將此限制放寬,讓Llama 3能與使用
1 年前

相關文章