硬科技:AMD 7nm製程CPU、GPU外 科科們更該知道的事

2018.11.13 01:26PM
Desktop Wallpaper, Multimedia, Graphics, Electronics, Sound, Energy, Display device, Product design, Computer Monitors, Computer, light, technology, light, computer wallpaper, darkness, multimedia, graphics, electronics, font, sound, energy

「嗯,可以,很不錯,這個很AMD,很像Lisa Su時代領導的AMD,極度務實,穩紮穩打,然後也沒講太多細節」大概是筆者對這次「7nm製程花火大會」唯一的感想,即使嚴格說來,乍看之下,沒啥實質的內容,在筆者眼中只留下了滿天的煙霧。

本月初的AMD “Next Horizon” 公佈了採用台積電7nm製程CPU與GPU的樣品與概要,這也是繼20年前的K7時代後,AMD再次取得「帳面上」對Intel的製程優勢。也毫不令人意外的,AMD先以高單價高利潤的高階產品線:伺服器的EPYC與做為「伺服器加速器」的Radeon Instinct MI,當成7nm製程的第一砲。但在「世界首度7nm製程的x86 CPU與GPU」之外,有更多足讓各位科科傲視如過江之鯽科技文青的弦外之音,值得細細品味慢慢推敲。

參考文章:

硬科技:讓AMD產品時程準確到位的Infinity Fabric

AMD 伺服器產品邁向 7nm 製程,發表在單晶片以 Infinity Fabric 溝通多矽晶的 EPYC " Rome "處理器與 AMD Radeon Instinct MI60

相信眼尖的科科看過AMD發表會時亮相的7nm製程EPYC樣品,勢必察覺到從原本的「四餡水餃」,一口氣變成「九餡」了:8顆7nm製程八核心晶片,加上1顆14nm製程的I/O處理器。

AMD為了節約成本,在第一世代的Zen家族,透過共通的「Zeppelin」SoC堆疊出不同的產品線,例如標準桌上型CPU (不含APU) 就1顆,EPYC就4顆,而Threadripper就塞4顆但只有2顆可動,以此類推。

AMD Ryzen 7 1800X, Ryzen, Central processing unit, Zen, , Advanced Micro Devices, AMD Ryzen 7 1700X, Intel, AMD Ryzen 5 2600X, Motherboard, art, blue, text, structure, art, pattern, line, design, area, symmetry, material

從內部架構圖亦可清楚看到Infinity Fabric的重要性,不只用來橋接不同功能單元的「血管」SDF,負責傳輸控制訊號並連接Zeppelin內多達2700個感測器的「神經」SCF,更是Zen微架構實現精密電源管理功能的基礎。

Line, Angle, Point, Product, Font, Special Olympics Area M, angle, text, line, font, area, product, angle, diagram, number, parallel

那問題來了,那AMD為何不蕭規曹隨,繼續沿用CPU核心與I/O在同一顆晶粒的作法?原因大概有3個:

  • 降低風險:7nm畢竟是很嶄新的製程,而I/O本來就是因較複雜的電氣特性,比較難以導入最尖端技術的部份,這決策實在無可厚非。
  • 效能考量:8顆處理器晶粒基本上已經等同於八處理器環境了,快取資料一致性協定的效率也會變成潛在的效能瓶頸,這對記憶體映射的I/O效率可能也有負面影響,所以AMD將I/O集中成一顆獨立輔助處理器,搞不好裡面也為了虛擬化應用,偷偷塞了啥新型的IOMMU也說不定。這顆I/O處理器,很可能也會有「其他的應用」。
  • 商業因素:系出AMD晶圓廠的Global Foundries雖然因「調整發展藍圖」中途放棄7nm製程百米賽跑,白白的把7nm製程訂單送給了「新歡」台積電,但基於分散風險,增加對晶圓代工業者的議價籌碼 (別忘了AMD還得跟Apple搶產能),並讓提供成熟14nm製程的「舊愛」有單可接。我們等著看這顆看起來還蠻大顆的I/O處理器,AMD會不會真的塞給Global Foundries生產,機率應該不低。

但有件事反倒需要觀望一下:新的7nm製程CPU SoC區塊究竟保留了多少I/O介面?總不可能單晶粒的桌上型7nm Ryzen也要多包顆I/O處理器吧?

參考文章:

硬科技:回顧AMD Zen微架構和EPYC (下)

硬科技:Intel邁向人工智慧晶片的一小步:Knights Mill

至於Zen2本身在微架構層面的改進,像改進分支預測、增加微指令快取容量、改善電力效率等,都屬於「理所當然」甚至令人哈欠連連的項目,但有2點倒是吸引了筆者的眼球:

  • SIMD執行單元從128位元擴展到256位元:不過還是沒有支援AVX-512,因為AVX-512已具備了諸多向量電腦指令集的概念,如遮罩暫存器 (Mask Register,用來標定資料暫存器中需要被處理的元素),無法直接以「512位元運算用256位元執行單元作兩次」,反正AMD手上握有GPU,針對高效能運算和人工智慧應用,也不缺「替代品」,說穿了也只是為了縮減成本。

Intel, Xeon Phi, Xeon, , Font, Web page, Bild, Product, Wiki, Area, web page, text, product, line, font, web page, product, area, software, media

參考文章

硬科技:被Intel處理器漏洞嚇傻前 科科們要先知道的事(下)

  • 強化對「幽靈 (Spectre,圖中的Variant 1和Variant 2)」的抵抗力:源自先前Google “Project Zero” 的研究報告引起宣然大波、而且全體預測執行的高效能CPU躺著集體中槍的安全性疑慮,AMD宣稱會在Zen2引進「解決方案」,就讓我們拭目以待。

寫了這麼多,各位科科一定會問:ㄟ,那7nm製程的GPU呢?可用Infinity Fabric多卡互連的Vega縮小版耶。咦?後面的Navi呢?

其實也沒啥好談的,相對於早已耕耘超過10年、在學術機構四處無所不在的競爭對手,AMD在GPGPU領域看不到NVIDIA的車尾燈,從來就不是單純的硬體不如人,而是欠缺軟體環境和市場開發,否則怎麼可能連最新的Top 500都看不到AMD GPU的鬼影子。

話說回來,歷史的教訓證明,當NVIDIA的GPU開始「肥大化」,AMD卻因削減成本走向精簡功能、縮小現有產品的保守路線,後者反而會撿到發動反擊的契機,過去R300和RV770就是很好的例證,如果7nm製程的Vega出現夠小、夠便宜、夠省電的消費級版本,倒是蠻令人感到期待,假若真的有的話。