觀點: Google Tensor 是一款缺乏自主架構設計前提之下,利用現有資源進行差異化的 Android 晶片平台

2021.10.20 04:17PM
照片中包含了釘、像素5、谷歌、修指甲、癮科技

Google 在昨天的 Pixel 6 系列發表會進一步針對 Google 首款自定義平台 Google Tensor 進行概念性的介紹, Google 始終不像蘋果、高通、三星與聯發科透露任何的核心數與架構配置,僅概括的介紹 Tensor SoC 內所具備的架構,並不斷強調 Tensor SoC 是一款著重真實使用體驗(是吃到 Intel 口水了嗎...?)的運算平台,

以筆者對於 Arm 目前生態的認知, Google Tensor 的真實意義恐怕還是在 Google 未完全投入自主架構開發前,亦無晶片商的晶片符合 Google 訴求的架構設計前, Google 以現成 Arm IP 作為基礎、並與其它產品做出明顯差異化的首款晶片產物。

▲ Google 強調 Tensor 不是以跑分為目的所設計,而是展現 Google 如何以 AI 提供最優質的真實使用體驗

Arm 的生態是多元且開放的, Arm 可提供最基礎的 CPU 指令集授權到完整的 CPU 、 GPU 微架構,近年又再提供 Ethos 神經網路加速器等,意味著晶片商可藉由這些現成的 IP 組合搭配自身專業領域建構出可用的 SoC 平台,但練兵多年已經掌握 CPU 微架構設計、 GPU 設計的蘋果目前已經展露出比起多半使用 Arm 標準 IP 更具能源效率的 SoC , Arm 陣營只能多半藉由更多核心或是疊加 GPU 的方式提升帳面數據。

以高通 Snapdragon 888 與三星 Exynos 2100 為例,扣除一些細節,兩者基本上在 CPU 的架構與配置規畫相當類似,只有 GPU 採用分別採用高通自主的 Adreno 與 Arm 的 Mali (三星預計下一代產品 GPU 轉向 AMD mRDNA 架構),另外聯發科的天璣系列 CPU 、 GPU 亦選用 Arm 的標準微架構 IP ,也因此除非具備如蘋果完整的自主架構規劃與研發能力,否則到一個程度後的高階手機 SoC 就是比拚如何壓榨製程極限塞入更多的電晶體與時脈。

縱使是蘋果也不是一開始就採用自主架構,也是一路上邊做邊學,陸續從由三星代工的處理器轉向自行設計 CPU 搭配 Imagination Technologies GPU ,慢慢自技術與專利累積到一個程度後才具備自主 CPU 與 GPU 架構(可想而知下一個被蘋果分手的應該就是高通的 5G 數據機了)。

▲ Tensor 的 TPU 架構是集結 Google 多年 AI 軟硬體研發的結晶

雖然不能排除 Google 已經投入自主架構設計之路,但別忘了所謂的自主研發不僅僅是需要具備研發動能,同時還要留意架構設計是否牽涉其它業界的專利,否則後續光是打專利戰就會耗掉更多的精力,這款隔空出世的 Google Tensor 在基本架構沒意外就是採用 Arm 標準 IP 之下的產物。

不過作為 Android 系統的供應者, Google 連續觀察幾年下來,大概也發現整個 Android 高階平台已經落入追求數據忽略真實體驗的盲點,當然這不能怪高通、三星與聯發科,畢竟跑分數字是最容易讓客戶理解的方式,多半 Android 旗艦機的使用者都會追求使用旗艦平台與跑分成績,也迫使晶片供應商在旗艦平台優先考慮跑分成績而非整體平衡。

Google 在 Tensor 的殺手鐧即是直接把 Tensor 架構整合到 SoC 當中, Google 以前也曾在 Pixel 機型使用獨立的 Vision Core 處理與影像相關的功能,不過 Tensor 又是不同的概念; Vision Core 是屬於獨立 ISP ,故僅能應用於影像處理領域,但 Tensor 則是推論加速器,是 Google 將其 TensorFlow 語言與 TPU 的開發經驗濃縮的產物。

雖然新一代的應用處理器當中也都具備 AI 加速器與支援異構運算,但顯然 Google 希望借助針對 Google 自身 AI 架構最佳化的 TPU 實現自身所希冀的異構運算效能,畢竟目前手機高階 SoC 的架構需考慮晶圓能夠容納的電晶體數量,一旦為了追求跑分帳面數據,勢必會縮減其它架構的可用空間, Tensor 內的 TPU 架構可視為 Google 在完整評估需求所規劃。

▲ Tensor 的雙核 Cortex-X1 是為了處理中度負載、高度負載如 AI 相關應用則仰賴更具效率的異構方式執行

從外媒取得的資訊, Google Tensor 在 CPU 採用 2+2+4 的配置,以雙核 2.8GHz Cortex-X2 搭配 2.25GHz Cortex-A76 與 4 核 Cortex-A55 ,且不同於 Android 陣營的核心應用概念, Google 將 Cortex-X1 架構應用在中等級的負載,像是手機喚醒、加載網頁等一瞬間需要喚醒運算力的應用,借助 Cortex-X2 的高效率縮減處理時間,且縱使時脈設定較低,也能以 Cortex-X2 先天更強的運算力較同樣情境使用 Cortex-A76 或 Cortex-A78 縮減處理時間。 Google 重申會採用此概念是評估過當前 Arm 標準微架構特質,如其它競爭對手使用單一高時脈 Cortex-X1 雖然具備出色的單執行緒跑分成績,但如果是為了實際體驗的快速反應,反而使用兩個時脈較低的 Cortex-X1 會是更出色的選擇。

參考資訊: Arstechina

而在重度負載如影像辨識處理等, Google 盡可能使用分散運算降低 CPU 的負擔,目前許多高階平台遇到使用進階 AI 功能時,經常發生特定架構負載過高而發熱、耗電等情況,而 Google Tensor 在此類複雜運算時,會盡可能將工作分配給合適的架構執行,根據外媒 Arstechica 的說法, Pixel 6 縱使錄製長達 20 分鐘的 4K 60P 短片,也沒出現處理器溫度飆升的問題。

不過也因為 Tensor SoC 採用 Google 的 TPU 進行 AI 加速, Google 本身更針對 Tensor SoC 架構的 AI 運算進行最佳化,若將 Pixel 6 的 AI 功能移植到先前的 Pixel 機型除了 AI 性能以外也會遇到執行效率不佳的問題,故此次包括魔術橡皮擦、臉部去模糊等新穎的 AI 功能僅能在 Pixel 6 系列流暢的使用。

照片中包含了手機、移動電話、產品設計、手機、角度

▲ Google Tensor 架構是 Google 團隊鑽研 Arm 微架構 IP 後規劃的結果,比起市面上其它 Android 旗艦平台更著重真實體驗

Google 最終是否會追隨業界趨勢走向 CPU 與 GPU 自主架構之路?筆者認為以 Google 持續自行研發各類架構之下,應該最終也是會選擇走這條漫長之路,畢竟從蘋果的結果完全證實 Arm 的 Cortex-A 微架構仍有許多能改善的地方,且高通已經確定將重啟自主 CPU 微架構,顯示如何進行更深度的差異化是各家廠商的當務之急,只是三星先前也變像證實若技術力不足的情況,最終還不如選擇公版微架構來的有效率。

但從 Google Tensor 的表現, Google 看起來也是針對 Arm 的微架構特性做足了功課才規劃了 2+2+4 CPU 這樣的設計,可說是檢視自身真正的需求,理解既有資源特質以及融合自主技術後的成果。

4 則回應