加深台灣合作關係,NVIDIA認為GPU加速運算成為延展摩爾定律主要模式

2018.05.31 08:34AM
345
是加深台灣合作關係,NVIDIA認為GPU加速運算成為延展摩爾定律主要模式這篇文章的首圖
首圖

在此次GTC Taiwan中,NVIDIA執行長黃仁勳期未來10年內,每年對於運算需求的規模將成長100倍,同時預期在摩爾定律逐漸衰減之下,全球前50大超級電腦的GPU運算量將在未來5年內成長15倍率,同時以GPU加速運算的方式將成為延展摩爾定律的主要模式。

是加深台灣合作關係,NVIDIA認為GPU加速運算成為延展摩爾定律主要模式的第1張圖

黃仁勳在GTC Taiwan再次強調過去NVIDIA創造CUDA運算模式所帶動加速效益,同時說明未來藉由GPU加速運算的模式將會持續擴大,預期在2028年全球運算需求將等同1000萬組Volta架構GPU所推動效能,若以傳統透過多組CPU堆疊構成超級電腦等級運算能力,將會佔據大規模空間及高額電力花費,若以GPU替換的話,則可節省更多空間與電力損耗,同時帶來更高加速效果。

就目前超級電腦底經成為現代科學發展重要工具,分別在分子建構、量子化學、量子力學、天氣預報、氣象研究、能源探索、物理模擬、資料分析與人工智慧技術發展扮演重要角色,並且提供百萬億次或百億等級運算效能。而就OpenAI統計顯示,未來5年內的人工智慧運算模型將成長30萬倍,相比摩爾定律預期成長速度快3萬倍,藉由GPU加速能力將可讓數據、演算程式複雜度大幅提昇,藉此解決過往人力無法解決運算需求。

去年宣布推出整合Tensor Core設計,並且整合32GB HBM2記憶體的Volta架構GPU,藉此對應125 Tensor TFLOPS運算效能,分別對應7.5 FP64 TFLOPS或15 FP32 TFLOPS預算效能,相比過往採用GPU加速運算模式可提昇10倍效率,同時進一步讓佔用空間與電力損耗大幅降低。

是加深台灣合作關係,NVIDIA認為GPU加速運算成為延展摩爾定律主要模式的第2張圖

而為了突破硬體架構限制,NVIDIA在今年的GTC 2018更進一步宣布推出NVSwitch,讓16組Volta GPU能共用高達512GB HBM2記憶體 (32GB x 16),總計可對應81920組CUDA核心、2000 Tensor Core TFLOPS運算效能,構成全球最高效能的GPU,並且不受傳統CPU架構限制GPU存取記憶體容量影響。藉由NVSwitch的設計,NVIDIA更宣布推出全球最大 (並且可遊玩遊戲)的DGX-2 GPU,對應藉由高達2PFLOPS運算效能,並且特殊多孔纖維設計讓運作功率高達10000W的機盒維持低溫運作,相比半年前正式推出的DGX-1運算效能提昇10倍。

相比過往必須藉由300組雙核心CPU構成、必須消耗180000W功率能耗運作的伺服器,透過單組DGX-2 GPU即可對應相同運算效能,但整替價格僅需1/8與1/18功率能耗,同時相比過往Alex 練Alex Krizhevsky透過兩張NVIDIA GTX 580 GPU,花費6天時間完成訓練AlexNet,藉由DGX-2 GPU僅需18分鐘即可完成。同時DGX-2 GPU也分別打破每秒分析1075個影像,成為最快單晶片運算速度,以及每秒可在每個節點處理15500個影像,並且可在14分鐘內完成擴充,推論延遲時間僅在1.1毫秒,每秒更可推論演算6250個影像。

透過DGX-2的運算能力與NVSwitch串接技術,NVIDIA也宣布推出以DGX-2建構的伺服器平台設計HGX-2,並且與廣達、雲達、富士康、英業達、緯創、緯穎、華碩、技嘉、華擎、泰安、宏碁等台灣在地廠商合作,同時強調全球約有90%伺服器源自台灣,而NVIDIA也與更多台灣在地廠商持續合作。

藉由GPU運算能力,配合與Adobe等軟體廠商合作的影像處理技術,將可實現即時修改影像中不必要物件,或是重建影像中缺乏內容,甚至能進一步呈現「美顏」效果。同時透過與Google提出的kubernetes容器集群管理系統合作,將可讓更多人工智慧系統能因應不同運算需求動態調整運算效能,藉此讓GPU架速運算效能有更彈性配置效益,將與阿里巴巴、百度、eBay、HIKVISION、IBM、小米等廠商合作。

是加深台灣合作關係,NVIDIA認為GPU加速運算成為延展摩爾定律主要模式的第3張圖

在與台灣合作部分,NVIDIA表示目前富士康將藉由人工智慧技術檢測製作生產效率,中國醫藥大學附設醫院透過人工智慧技術協助醫師分析預測癌症腫瘤轉移情況,台灣大學則透過人工智慧區分鼻咽癌危及器官,而台灣人工智慧實驗室也透過人工智慧技術協助台南市政府監測橋樑結構預防颱風損害,桃園市政府則計畫在2020年前讓30%固定行駛路線的公車能配置Level 3自動駕駛功能。

如同先前在GTC 2018期間以「PLASTER」作為主題演講結尾,黃仁勳也強調分別藉由可編程 (Programmability)、低延遲 (Latency)、高精準度 (Accuracy)、規模化 (Size)、資料吞吐量 (Throughput)、能耗效率 (Energy Efficiency),進而推動學習訓練效率 (Rate of Learning),讓人工智慧能以更快速度成長。

※相關連結》

回應 0
科技應用
人渣文本談網路選戰:別太依賴數位,肉身也得顯靈!
INSIDE網路趨勢觀察
1 天前
科技應用
一圖看懂 林口新創園「一站式服務」
討喜小姐 陳薪智
2 天前

熱門文章

最新消息

本日精選