美國加州柏克萊勞倫斯柏克利國家實驗室(Lawrence Berkeley National Laboratory)公布突破性的超級電腦計畫Doudna以及其理念,Doudna為加速諾貝爾獎及科學研究所設計,也將象徵美國在HPC領域領導地位的重大國家級投資,確保美國研究人員可掌握最頂尖的工具應對全球關鍵挑戰;Doudna以NVIDIA下一代的Vera Rubin平台驅動,結合AI與模擬運算能力,旨在協助美國頂尖科學探索與研究者解決核融合、天文學與生命科學領域的未來挑戰,預計在2026年啟用。
不僅著重性能、更重視影響力的次世代超級電腦系統
左為Jennifer Doudna,中為NVIDIA執行長黃仁勳、右為Dell資深副總裁暨資深技術研究員Paul Perez
Doudna也稱為NERSC-10,以諾貝爾獎得主與CRISPR基因編輯技術先驅Jennifer Doudna命名,她本人也出席計劃公佈活動,不僅追求運算速度,更著重在這套系統的影響力;Doudna由Dell基礎設施做為基本架構,並採用NVIDIA下一代平台Vera Rubin,專為美國能源部迫切的科學任務即時探索所量身打造,使美國研究人員得以藉此進行科學領域的創新與突破,同時鞏固美國在關鍵技術領域的競爭優勢。
旨在帶來突破性的嶄新架構
有別於過往超級電腦多為單一領域功能,Doudna將模擬運算、資料處理與AI技術無縫整合在單一協作平台,作為加速一系列科學工作流程所規劃;Doudna可將能源科學網路(ESnet)連接到美國能源部的實驗與觀測設施,使科學家可將美國各地的數據無縫傳輸到系統並進行幾乎即時的分析;同時Doudna可提供11,000名研究人員幾乎即時的回應能力與整合工作流程,協助科學家探索更複雜的問題並在更短的時間找到解答。Doudna不僅為更快而生,而是一套能夠協助研究人員廣泛思考與更快發掘問題的突破性系統。
鎖定多項領域的科學研究
Doudna期許可在四大領域推動重大突破,包括核融合、材料科學、藥物探索與天文學;於核融合領域可透過模擬技術的突破加速潔淨的核融合能源,在材料科學可結合新型超導材料的AI模型探索更多的可能性,在藥物探索則能透過高速的工作流快速摺疊蛋白質、搶在疫情發生前超前部署,在天文學則可即時處理美國基特峰國家天文台案能量光譜儀資料快速的繪製宇宙地圖。
更快、但更節能
預期Doudna能夠比現行的Perlmutter系統實現高出10倍的科學成果,但使用的能量僅為Perlmutter的2倍至3倍,也表示Doudna在每瓦效能可提升3到5倍,關鍵在於包括晶片設計、動態負載平衡與系統及效率的創新。
結合AI驅動的大規模發現
Doudna的高度整合平台,進一步使AI技術能夠加速科學領域進行突破;其中2024年諾貝爾獎得主David Baker利用美國國家能源研究科學運算中心系統來支援其使用AI技術預測新型蛋白質結構的工作,解決跨科學領域的難題;Benjamin Nachman 等研究人員正在運用 AI 技術「展開」粒子物理資料中探測器失真的情況,並且分析電子質子對撞機實驗所得的質子資料;包括勞倫斯伯克利國家實驗室與Meta在內的合作夥伴開發運用 AI 精準模擬複雜分子化學反應的大型資料集「Open Molecules 2025」,相關研究人員的AI模型同樣仰賴美國國家能源研究科學運算中心。
高速、低延遲的網路架構系統使科學探索更為即時、不間斷
▲透過ESnet與Dougna直接連接,基特峰國家天文台暗能量光譜儀的資料可更快速描繪成宇宙地圖
Doudna將超級電腦從科學探索的被動參與者化為工作流程的一部分,借助NVIDIA Qualtum-X800 InfiniBand作為美國能源部ESnet的骨幹架構,包括望遠鏡、探測器與基因定序儀的資料能夠近乎即時的傳輸至Doudna,同時利用智慧型服務品質機制優先處理,確保資料字輸入至深入分析過程快速而不中斷;以美國DIII-D國家核融合點火實驗設施為例,控制室的即時事件資料得以即時傳輸到Doudna並快速進行離子建模,使科學家可即時進行調整。
接軌量子與高效能運算工作流程
Doudna將HPC、AI、即時串流與量子運算流程整合,為下一代量子運算探索帶來更多可能性,其中包括支援可擴展的量子演算法開發,借助NVIDIA CUDA-Q等平台共同設計未來整合式量子與高效能運算系統;這些工作流程都是建構在NVIDIA下一代Vera Rubin平台之上;Vera Rubin結合高效能CPU、統一記憶體的GPU,使所有的處理器能借助統一記憶體直接存取與共享資料。
同時Doudna為了提供前瞻擴展性,預計將採用新一代NVIDIA Quantum-X800 Infiniband,使網路運算效能提高9倍,使工作負載能存取更多運算與記憶體,並突破NVLink網域限制;此外研究人員已經PyTorch、NVIDIA Holoscan軟體開發套件、TensorFlow、NVIDIA cuDNN 以及NVIDIA CUDA-Q等框架來移植完整的管道,這些框架皆針對Rubin GPU與NVIDIA NVLink架構進行最佳化。當前已有超過20個研究團隊透過美國國家能源研究科學運算中心的科學家速計畫把工作流移植到Doudna,包括氣候模,不僅涉及原始運算,也包括自構想到洞察的整合發現。到洞察的整合發現。