硬科技：AMD 7nm製程CPU、GPU外科科們更該知道的事 (139166)

Desktop Wallpaper, Multimedia, Graphics, Electronics, Sound, Energy, Display device, Product design, Computer Monitors, Computer, light, technology, light, computer wallpaper, darkness, multimedia, graphics, electronics, font, sound, energy

「嗯，可以，很不錯，這個很AMD，很像Lisa Su時代領導的AMD，極度務實，穩紮穩打，然後也沒講太多細節」大概是筆者對這次「7nm製程花火大會」唯一的感想，即使嚴格說來，乍看之下，沒啥實質的內容，在筆者眼中只留下了滿天的煙霧。

本月初的AMD “Next Horizon” 公佈了採用台積電7nm製程CPU與GPU的樣品與概要，這也是繼20年前的K7時代後，AMD再次取得「帳面上」對Intel的製程優勢。也毫不令人意外的，AMD先以高單價高利潤的高階產品線：伺服器的EPYC與做為「伺服器加速器」的Radeon Instinct MI，當成7nm製程的第一砲。但在「世界首度7nm製程的x86 CPU與GPU」之外，有更多足讓各位科科傲視如過江之鯽科技文青的弦外之音，值得細細品味慢慢推敲。

參考文章：

硬科技：讓AMD產品時程準確到位的Infinity Fabric

AMD 伺服器產品邁向 7nm 製程，發表在單晶片以 Infinity Fabric 溝通多矽晶的 EPYC " Rome "處理器與 AMD Radeon Instinct MI60

相信眼尖的科科看過AMD發表會時亮相的7nm製程EPYC樣品，勢必察覺到從原本的「四餡水餃」，一口氣變成「九餡」了：8顆7nm製程八核心晶片，加上1顆14nm製程的I/O處理器。

AMD為了節約成本，在第一世代的Zen家族，透過共通的「Zeppelin」SoC堆疊出不同的產品線，例如標準桌上型CPU (不含APU) 就1顆，EPYC就4顆，而Threadripper就塞4顆但只有2顆可動，以此類推。

從內部架構圖亦可清楚看到Infinity Fabric的重要性，不只用來橋接不同功能單元的「血管」SDF，負責傳輸控制訊號並連接Zeppelin內多達2700個感測器的「神經」SCF，更是Zen微架構實現精密電源管理功能的基礎。

那問題來了，那AMD為何不蕭規曹隨，繼續沿用CPU核心與I/O在同一顆晶粒的作法？原因大概有3個：

降低風險：7nm畢竟是很嶄新的製程，而I/O本來就是因較複雜的電氣特性，比較難以導入最尖端技術的部份，這決策實在無可厚非。
效能考量：8顆處理器晶粒基本上已經等同於八處理器環境了，快取資料一致性協定的效率也會變成潛在的效能瓶頸，這對記憶體映射的I/O效率可能也有負面影響，所以AMD將I/O集中成一顆獨立輔助處理器，搞不好裡面也為了虛擬化應用，偷偷塞了啥新型的IOMMU也說不定。這顆I/O處理器，很可能也會有「其他的應用」。
商業因素：系出AMD晶圓廠的Global Foundries雖然因「調整發展藍圖」中途放棄7nm製程百米賽跑，白白的把7nm製程訂單送給了「新歡」台積電，但基於分散風險，增加對晶圓代工業者的議價籌碼 (別忘了AMD還得跟Apple搶產能)，並讓提供成熟14nm製程的「舊愛」有單可接。我們等著看這顆看起來還蠻大顆的I/O處理器，AMD會不會真的塞給Global Foundries生產，機率應該不低。

但有件事反倒需要觀望一下：新的7nm製程CPU SoC區塊究竟保留了多少I/O介面？總不可能單晶粒的桌上型7nm Ryzen也要多包顆I/O處理器吧？

參考文章：

硬科技：回顧AMD Zen微架構和EPYC (下)

硬科技：Intel邁向人工智慧晶片的一小步：Knights Mill

至於Zen2本身在微架構層面的改進，像改進分支預測、增加微指令快取容量、改善電力效率等，都屬於「理所當然」甚至令人哈欠連連的項目，但有2點倒是吸引了筆者的眼球：

SIMD執行單元從128位元擴展到256位元：不過還是沒有支援AVX-512，因為AVX-512已具備了諸多向量電腦指令集的概念，如遮罩暫存器 (Mask Register，用來標定資料暫存器中需要被處理的元素)，無法直接以「512位元運算用256位元執行單元作兩次」，反正AMD手上握有GPU，針對高效能運算和人工智慧應用，也不缺「替代品」，說穿了也只是為了縮減成本。