Computex 2017:ARM要Cortex-A75、Cortex-A55與Mali-72帶來AI革命

2017.05.30 11:20AM
427
是Computex 2017:ARM要Cortex-A75、Cortex-A55與Mali-72帶來AI革命這篇文章的首圖

ARM 今年在 Computex 所宣布的三項 IP 架構是相當重要的一個里程碑,因為對於 ARM 而言,全新的架構不僅是帶來更強大的運算力,同時更是以人工智慧世代所需所規劃,全新的 Cortex-A75 以及 Cortex-A55 所支援的 DynamiQ 可使工作負載更為最佳化,而 Mali-G72 則更進一步提升深度學習的性能,稍早也與 ARM 的技術專家針對昨天所發表的三項架構進行探討。

DynamIQ 的特性先前已經進行多次的介紹,簡單的說就是透過 Cluster 層的全新設計,使得單一 Cluster 能夠容納最多 8 核心,且同 Cluster 可容納大核與小核,每個核心的時脈與電壓更能獨自管理,同時透過 Cluster 共用 L3 的方式提升協作性能;由於單一 Cluster 核心增加加上可針對不同應用的性能分化,對於人工智慧相關應用更能進行有效率的多工分配。

074916e8af4958c049e3505492d9768f

不過在昨天所發出的資訊中, Cortex-A75 即便在 DynamIQ 設計下,僅能在單一 Cluster 具備最多 4 核心,若要達到 8 核心就需要搭配 4 核心的 Cortex-A53 ,但 Cortex-A53 則能在單一 Cluster 中配置 8 核心,其中的原因, ARM 副總裁 Nandan Naampally 也做出回答。

Nandan 表示,在單 Cluster 內僅能提供最多 4 核心的 Cortex-A75 的關鍵,是有實際情境以及架構設計雙重考量;由於在行動裝置應用最多僅能應用到四核心,而在運算系統中多半是以四核心作為一個單位的設計,若是在大型架構中,仍是可透過多 Cluster 串接多個 4 核心的 Cortex-A75 Cluster 。

在架構設計方面的考量,由於 Cortex-A75 屬於高效能層級的核心,故對於頻寬的需求也較高,若在單一 Cluster 中規劃超過 4 核心,則會對共用記憶體的頻寬產生較高的負擔;其次是 Cortex-A75 的能耗與發熱也較高,單一 Cluster 內若全為 Cortex-A75 則也會對能耗管理產生不利。

關於在今年即將發酵的 Windows on ARM 計畫,  Nandan 表示相當樂觀其成,在微軟與開發商的努力下,不少主流軟體開發商將會針對 ARM 進行最佳化,並可在 Windows Store 提供原生支援 ARM 的新版軟體,至於舊版 x86 軟體則可透過模擬器的方式讓 CPU 可支援,至於 GPU 則不需進行轉譯,故若執行舊版軟體的效能會依照軟體對 CPU 與 GPU 負擔的權重而定。

7439d66ddd024ece016512cf0cf9c8ae

至於 Mali-G72 則是 Bifrost 架構的第二款高效能 GPU ,不同於當初 Mali-G71 是針對行動裝置設計, Mali-G72 鎖定的範圍更廣泛,也包括工業相關領域如機器視覺以及自動駕駛應用,影像處理器事業部資深產品經理 Espen Oybo 表示, Mali-G72 不僅是從架構方面著手,同時也與業界如遊戲引擎、演算法進行深度結合,使其在娛樂與深度學習領域有更高的效能。

不過目前 Mali-G72 的應用領域並非更深入往高效能運作發展,仍是以偏向行動裝置以及嵌入式應用為主,而相較於 Mali-G71 , Mali-G72 的基礎效能也再度提升 40% ,同時針對深度學習語法強化,亦可使在行動裝置上使用深度學習應用如影像、語音辨識有更好的速度,而 Mali-G72 的最大核心則可堆疊到 32 核( MP32 )。

e1d0ca36929f00b848b939c4d755f74c

96910f03348060dbe7021304aaaf3c13

ARM 也在展示區展示其基於深度學習的影像辨識,這項應用中透過 CPU 、 GPU 與 Neon 彼此協作,並藉由具備測距的相機鏡頭,可針對物體的尺寸與類別進行分辨,能夠判讀如桌上的蘋果、柳丁、葵花子等的質量以及卡路里。

回應 0
專家觀點
ICO防騙守則:掌握三個W 判斷區塊鏈案子或虛擬貨幣
INSIDE網路趨勢觀察
9 個小時前

熱門文章

最新消息

本日精選