GTC 2025:NVIDIA公布NVIDIA Dynamo開源推論模型架構,透過分散式運算可協調並加速數千個GPU的推論通訊
NVIDIA在GTC 2025不僅公布Blackwell Ultra加速運算GPU,還宣布對於當前資料加速運算產業相當重要的開源AI推論服務軟體NVIDIA Dynamo;NVIDIA Dynamo是作為協調與加速數千個的GPU的推論通訊,利用分散式運算特性於大型語言模型的處理與產生分配到不同的GPU,可針對特定需求單獨將每個階段最佳化;NVIDIA Dynamo不僅完全開源,還支援包括PyTorch、SGLang、NVIDIA TensorRT-LLM和 vLLM,企業、新創與研究人員可使用熱門的AI框架進行部署,同時實現分散式推論,可提升AI工廠(AI Factory)服務的性能、縮減回應
3 個月前
Twitch實況主讓AI自主學習遊玩寶可夢紅版 已擊敗小剛與小霞
打從 AI 技術漸漸崛起後,許多產業人士都開始擔心自己可能會被 AI 取代,但在此同時,不少人也用 AI 技術進行了各種有趣的實驗或是創作。像是在最近 Twitch 實況主也突發奇想,試圖讓 AI 自主學習如何遊玩《寶可夢》遊戲。 目前依然正在持續直播中的 Twitch 頻道 ClaudePlaysPokemon 展示了一個名為 Claude 的大型語言模型(LLM) 學習如何遊玩《寶可夢 紅/藍》版本的過程。這讓不少玩家聯想到 10 年前紅極一時的「TwitchPlaysPokemon」,當時實況主讓成千上萬的觀眾一同在聊天室中透過輸入指令來操作遊戲,最終連續成功突破了多款《寶可夢》系列作品
3 個月前
AMD為Radeon RX 9000系列新增不需連網的AI互動式聊天功能AMD Chat,初期以幫助玩家解決設定問題為主
AMD宣布為基於RDNA 4架構的Radeon RX 9000系列顯示卡推出稱為AMD Chat的互動式AI助理,AMD Chat將作為AMD Software的一部分,透過Radeon RX 9000的硬體提供免連網的互動式AI體驗,初步將聚焦在解決玩家AMD相關的產品資訊、技術介紹與硬體設定疑惑,使玩家能透過自然語言、上傳文件等方式與AMD Chat互訂,並利用AMD的技術知識庫為基礎獲得正確的資訊。 ▲AMD Chat強調可在非連網情況執行,並回答玩家關於AMD產品、技術與裝置設定問題 簡單的說,AMD Chat可視為基於裝置端AI的互動式客服機器人,利用大型語言模型與RDNA 4的硬體
3 個月前
Arm執行長Rene Hass看衰DeepSeek,認為很快就會步TikTok後塵被美國禁止
DeepSeek的出現攪亂AI發展的一池春水,尤其在農曆年前閃電曝光的前幾天除了各大新聞版面鋪天蓋地的報導以外,也直接衝擊到AI晶片相關產業,直至現在已經步入2025年的2月仍有不少餘波;不過Arm執行長Rene Hass在接受Financial Times專訪時直言,他認為DeepSeek在美國很快就會步入TikTok後塵被禁止,Rene Hass表示倘若TikTok在美國被禁,DeepSeek也會由於相同的理由在中國被禁、亦即牽涉到資料送往中國的問題。 ▲Rene Haas認為DeepSeek雖為AI市場帶來驚嘆號,但背後卻沒有太多革命性的技術 Rene Haas闡述他對DeepSeek的
4 個月前
Google Gemini Live正式支援繁體中文,還可選擇對話語調更親切
Google宣布其自然對話服務Gemini Live以及Gemini擴充功能即日起支援繁體中文,使台灣的用戶能夠以習慣的自然語言與Gemini互動,還可選擇不同的語氣風格,使Gemini Live化身最貼身的生活小助理;除此之外Google也自即日起為Gemini Live開放多種語系,只要是開放Gemini服務地區的用戶皆可選擇最多兩種語言使用Gemini Live。 Google預計自即日起的幾天陸續提供已開放Gemini應用程式的用戶使用在地語言 ▲Gemini Live可提供幾種不同的對話語氣風格 Gemini Live的特色是透過自然語言與用戶互動,猶如與朋友對話一般,能夠用於腦力激
5 個月前
NVIDIA為NVIDIA NeMo Guardrails導入三項NIM微服務,確保AI代理高效率、正確且安全
現在許多大型企業正透過AI代理建構「知識機器人」,將公司的海量資料庫利用生;NVIDIA宣布針對AI代理提供具安全保障的三項NIM微服務,為NVIDIA NeMo Guardrails軟體工具提供安全性、準確性與可擴擴性。包括Amdocs、Cerence AI、Lowe’s等大型企業皆導入NVIDIA NeMo Guardrails作為內部服務AI功能的防護機制。 具備三項新NIM微服務的NVIDIA NeMo Guardrails,以及用於檢測AI可靠與越獄保護力的NVIDIA Garak工具包已開放開發者與企業使用,開發者限在可透過NVIDIA NeMo Guardrails在客戶服務的A
5 個月前
CES 2025:AMD推出採用統一記憶體架構並整合高性能CPU與獨顯級GPU的Ryzen AI MAX行動平台
AMD在CES 2025最大的亮點莫過於在行動平台推出全新的產品線Ryzen AI Max系列,此系列不同於一般行動處理器搭配夠用的GPU,而是採用達到與入門獨立顯示卡效能近似的高性能整合GPU,同時搭配統一記憶體架構,使Ryzen AI Max足以執行高階獨立顯示卡也無法執行的大型語言模型與混合模型。 ▲HP放眼工作站產品,華碩則用於輕薄電競筆電 Ryzen AI MAX鎖定高階電競筆電與行動工作站、微型工作站產品,同時提供商用的PRO版本,強調能以更具效率、節能的方式執行各式的遊戲與專業內容創作內容,預計在2025年第一季至第二季之間上市。 ▲Ryzen AI Max系列為Ryzen平台再
6 個月前
蘋果推出M4、M4 Pro與M4 Max版14吋與16吋MacBook Pro,並宣布MacBook Air初始記憶體提升至16GB且售價不變
蘋果接連三天於同一時間線上公布搭載M4處理器的產品線,在第三天登場的是搭載M4、M4 Pro與M4 Max處理器的14吋與16吋MacBook Pro,全面搭載12MP Center Stage相機,其中M4 Pro與M4 Max處理器提供Thunderbolt 5介面,官方預估續航力達20小時以上;另外廣受歡迎的MacBook Air機型將販售中的機型全面提高基礎記憶體容量,仍在販售中的M2與M3版MacBook Air提升至16GB RAM,同時價格維持與8GB版本相同。 ▲M4系列MacBook Pro提供14吋與16吋兩種大小 搭載M4系列處理器的14吋與16吋MacBook Pro將
8 個月前
NVIDIA團隊釋出NVLM 1.9多模態大型語言模型,視覺語言媲美GPT-4o、Llama 3-V 40.5B、InternVL 2抗衡
NVIDIA研究團隊重磅釋出NVLM 1.0開源多模態大型語言模型,最大版本NVLM-D-72B達720億參數(72B),開發團隊聲稱其視覺語言精確度媲美業界領先的GPT-4o私有模型以及Llama 3-V 40.5B、InternVL 2等開源模型,在舉出的例子甚至還包括理解迷因圖;不過NVLM 1.0旨在強化AI產業的發展,僅供作為研究,不允許商業使用。 ▲以執行長黃仁勳的照片為例展現出色的指令追蹤能力,並為圖片提供高品質且詳盡的描述 ▲甚至可以理解迷因圖背後想表達的意涵 NVIDIA研究團隊表示NVLM 1.0可在視覺語言與純文字的項目與領先的大型語言模型相當,甚至在OCRBench 和
9 個月前
NVIDIA Blackwell正式於MLPerf Inference基準測試活動亮相,於Llama 2 70B推論性能提升4倍
NVIDIA在2024年3月的GTC大會公布全新架構的Blackwell加速器,隨著Blackwell步入量產急將出貨,Blackwell首次於MLPerf Inference v4.1基準測試活動亮相,並在所有資料中心測試項目刷新紀錄,其中於處理MLPerf最大LLM工作量的Llama 2 70B,相較NVDIA H100 Tensor Core GPU高出4倍。 ▲Blackwell首次測試的成績相當亮眼 雖然Blackwell仗著新架構刷新各項紀錄,然而基於Hopper架構的NVIDIA H200 Tensor Core GPU也在此輪的於MLPerf Inference基準測試有亮眼的
10 個月前
友站推薦
【Howie 商業投資】哪個人工智慧模型最常侵犯版權?
INSIDE - Howie Su
【Howie 商業投資】生成式 AI 唬爛怎麼解?AI21 Labs 積極讓大型語言模型提供無誤資訊
INSIDE - Howie Su
阿里巴巴不甘示弱,發佈 AI 對嘴模型「EMO」可生成逼真表情動作
INSIDE - Jocelyn

相關文章