Tesla 在 Tesla 自動駕駛日的活動除了宣布下一代自動駕駛平台外，亦針對這套自行設計開發的平台架構進行深入的介紹， Tesla 自行設計的自動駕駛平台採用雙處理器設計，而每個處理器都是一顆具備完整功能、高度整合的 SoC ，採用 14nm FinFET 製程而非求最先進工藝應該也有降低成本的意圖。

Tesla 新一代自動駕駛平台的雙處理器架構是為了安全考量，以單處理器執行、另一顆處理器進行雙重驗證，並且兩邊採用獨立的供電進一步降低風險。每個處理器整合包括 CPU 、 GPU 、相機管理、影像解碼、記憶體通道，還有專屬的深度神經網路處理器架構，共使用達 60 億個電晶體。

這顆處理器的設計上， ISP 每秒可處理 1GP 畫素的數據，並提供 128bit 、 86GBps 的 LPDDR4 記憶體頻寬，影像編碼器相容 H.265 格式，另外除了車載級的安全管控外，還有 Tesla 設計、執行專屬代碼的硬體安全機制。

以 CPU 與 GPU 而言， Tesla 的處理器並稱不上高階的架構，搭載 12 核的 2.2GHz Cortex-A72 (註：當前 Arm 微架構已經進入 Cortex-A75 / Cortex-A76 世代)，而 Cortex-A72 仍屬於 big.LITTLE 世代架構，故應該為 3 個 4 核心群組構成；另外 GPU 的時脈設定在 1GHz ，具備 600GFLOPS 性能，這部分的架構仍主要用於處理基礎底層系統。

而為了實現高效率的自動駕駛性能， Tesla 把重點放在硬體 AI 加速器上， Tesla 為這顆核心導入大面積的 NNP 深度學習神經網路處理器，具備 96x96 的乘法/加法陣列，配有 32MB 的 SRAM 等，在 2GHz 的時脈下可達到 36TOPS ，在搭載兩顆處理器的自動駕駛平台，能夠具備高達 72TOPS 的整體深度學習處理性能。

Tesla 的想法是高達 99.7% 的神經網路處理仰賴加法與乘法指令，故透過支援 32bit 整數加法與 8bit 乘法的 NNP ，可實現良好的 AI 性能，由於 AI 運算是即時處理，不需要把數據轉存到外部儲存，故 SRAM 的效率相當充裕，同時利用整合低功耗 32MB SRAM 可達到比 DRAM 少 100 倍的功耗。此外，為了龐大的外部影像感測器的圖片資訊，每個 NNP 有高達 1TB 的通道頻寬。

Chevelle.fu

猜你喜歡

Chevelle.fu

相關消息