AWS 與 NVIDIA 攜手開發下世代基礎設施,助力大型機器學習模型訓練和生成式 AI 應用程式建構
部署在 Amazon EC2 UltraCluster 中的新型 Amazon EC2 P5 執行個體經過充分優化,可以利用 NVIDIA Hopper GPU 加速生成式 AI 的大規模訓練和推論 Amazon Web Services(AWS)和NVIDIA(輝達)宣佈了一項多方合作,致力於建構全球最具可擴展性且隨需付費的人工智慧(AI)基礎設施,以便訓練日益複雜的大型語言模型(LLM)和開發生成式AI應用程式。 借助於NVIDIA H100 Tensor Core GPU支持的下世代Amazon Elastic Compute Cloud(Amazon EC2)P5執行個體,以及AWS最
9 個月前
AWS 宣布 Amazon EC2 P5 執行個體正式可用,加速生成式 AI 和高效能運算應用 由 NVIDIA H100 Tensor Core GPU 驅動
亞馬遜旗下公司 Amazon Web Services(AWS)近日在紐約峰會上宣布 Amazon Elastic Compute Cloud(EC2)P5 執行個體正式可用。這是一款下世代 GPU 執行個體,由最新的 NVIDIA H100 Tensor Core GPU 驅動,可以滿足客戶在執行人工智慧、機器學習和高效能運算工作負載時對高效能和高擴展性的需求。與上一代基於 GPU 的執行個體相比,Amazon EC2 P5 執行個體可以將訓練時間縮減 6 倍(從幾天縮短到幾小時),幫助客戶節省高達 40% 的訓練成本。 Amazon EC2 P5 執行個體提供 8 個 NVIDIA H10
9 個月前
AWS 實驗室內部直擊:資料中心退役硬體的華麗下半場 AWS 逆向物流計畫:不僅為零組件再利用提供永續發展途徑,亦保護資料安全
Amazon Web Services(AWS)資料中心遍布全球,且由具領先技術的伺服器機架(server rack)組成。然而,儘管這些伺服器承載著全球領先的技術,它們最終仍然會像所有硬體一樣,需要不斷更新換代。為了延長硬體的使用壽命,AWS 將資料中心裡所有功能齊全、經過資料清除的退役伺服器機架和零組件發送到逆向物流中心,將伺服器機架安全地進行拆解,對其零組件進行修復和測試,以供再利用。 該專案作為亞馬遜推行《氣候宣言》的其中一項措施,將助力 AWS 實現 2040 年「淨零碳排」的目標。AWS 的伺服器機架遵循三大循環經濟原則: (一) 設計時遵循重複利用的原則 (二) 保持設備高效運行
9 個月前
AWS 宣布推出 AWS SimSpace Weaver 實現動態 3D 模擬與空間建模
該完全託管服務為客戶實現複雜、動態的 3D 模擬,可進行具有百萬個以上物件的系統建模,快速預測現實世界的結果以及創建沉浸式訓練空間 太空技術公司洛克希德馬汀(Lockheed Martin)與互動娛樂公司 Epic Games 等客戶與合作夥伴已經開始使用 AWS SimSpace Weaver 建構數位孿生(Digital Twins)與空間模擬 Amazon Web Services(AWS)在 2022 AWS re:Invent 全球盛會上宣布推出完全託管的運算服務 AWS SimSpace Weaver,幫助客戶建構、維運和執行大規模的空間模擬。借助 AWS SimSpace Wea
9 個月前
AWS 宣布推出 Amazon Q 重塑未來工作方式
原生支持安全和隱私保護的新型生成式 AI 助理,使員工能夠運用公司資料和專業知識進行問答、解決問題、生成內容並採取行動 埃森哲(Accenture)、BMW 集團、吉立亞(Gilead)、Mission Cloud、Orbit Irrigation 和 Wunderkind 等客戶和合作夥伴都期待使用 Amazon Q 亞馬遜(Amazon)旗下 Amazon Web Services(AWS)在 2023 re:Invent 全球大會上宣布推出 Amazon Q ,這是一種新型的生成式 AI 助理,專門用於滿足辦公需求,且可以根據客戶業務進行訂製。基於客戶自身的資訊儲存庫、程式碼和企業系統,
9 個月前
Amazon Bedrock 發布更多模型選擇和全新強大功能 助力建構安全和規模化生成式 AI 應用程式
Anthropic、Cohere、Meta、Stability AI 和亞馬遜最新的高效能模型將為客戶提供更豐富的業内領先模型選擇,以支援各種應用場景 Amazon Bedrock 的模型評估功能夠讓客戶評估、比較和選擇最適合其應用場景和業務需求的模型 Amazon Bedrock 的知識庫功能簡化生成式 AI 應用程式的開發流程,使用私有資料來提供即時的客製化回應 Amazon Bedrock 中的 Cohere Command、Meta Llama 2 和 Amazon Titan 模型支援微調,為客戶的模型定制提供更多選項, Anthropic Claude 亦即將提供調校功能 借助 A
9 個月前
AWS 與 NVIDIA 宣布策略合作 針對生成式 AI 推出全新超級電腦基礎設施、軟體及服務
AWS 推出首款結合 NVIDIA Grace Hopper Superchip 超級晶片與 AWS UltraCluster 擴充技術的 AI 超級電腦 NVIDIA DGX Cloud 率先配備 NVIDIA GH200 NVL32 ,並首次在 AWS 上提供此 AI 訓練即服務 NVIDIA 和 AWS 在 Project Ceiba 上的合作,設計全球最快的 GPU 驅動 AI 超級電腦以及最新的 NVIDIA DGX Cloud 超級電腦,為 NVIDIA 的 AI 研發以及自訂模型開發服務 配置 NVIDIA GH200、H200、L40S、以及 L4 GPU 等核心的全新 Ama
9 個月前
AWS 推出新一代自研晶片
AWS Graviton4 是目前 AWS 效能最強、最具能源效率的自研晶片,支援廣泛的雲端工作負載 AWS Trainium2 提供 AWS 上用於模型訓練的最高運算效能,提高訓練速度、降低成本及能耗 亞馬遜(Amazon)旗下 Amazon Web Services(AWS)於 AWS re:Invent 全球盛會上宣布,自研晶片的兩個系列推出新一代,包括 AWS Graviton4 和 AWS Trainium2,為機器學習(ML)訓練和生成式人工智慧(AI)應用等廣泛的工作負載提供更高性價比和效能。Graviton4 和 Trainium2 是 AWS 自研晶片的最新創新,AWS 每一
9 個月前
AWS 推出五項 Amazon SageMaker 新功能,助力規模化開發應用模型
Amazon SageMaker HyperPod 透過為大規模分散式訓練提供專用的基礎架構,將基礎模型的訓練時間縮短了高達 40% Amazon SageMaker Inference 透過優化加速器,平均降低 50% 的基礎模型部署成本,並平均縮短了 20% 的延遲時間 Amazon SageMaker Clarify 能夠讓客戶更輕鬆地根據支援負責任的 AI 的參數,迅速評估和選擇基礎模型 Amazon SageMaker Canvas 功能幫助客戶透過自然語言指令加速準備資料,並僅需幾次點擊即可使用基礎模型進行模型訂製 BMW 集團、Booking.com、Hugging Face、P
9 個月前
AWS 宣布生成式 AI 助理 Amazon Q 正式可用 助企業運用內部資料並加速軟體開發
Amazon Q Developer具有業界領先的程式設計準確性、頂尖的安全性和最全面的雲端能力,讓開發人員能夠將更多精力投入於優化程式,減少與程式設計無關的重複性維護工作。 Amazon Q Business旨在增強員工的資料驅動能力,協助他們生成內容、建構報表,並利用公司的內部資源及資料做出更迅速、明智的決策。 Amazon Q Apps是Amazon Q Business的一個全新且強大的功能,它使員工能夠利用自然語言快速且安全地建構自己的生成式AI應用程式,以自動化日常工作。 來自各行各業、不同規模的客戶和合作夥伴都在使用Amazon Q來改革員工的工作方式,包括埃森哲(Accentu
9 個月前

相關文章