NVIDIA 在發表第三代 GeForce RTX 的 Ada Lovelace 架構,也宣布 DLSS 3 影像強化技術, DLSS 3 進一步針對 Ada Lovelace 架構導入專屬的 Frame Generation 技術; DLSS 技術借助 AI 技術進行影像強化提升幀率,同時影像品質甚至可超越原生解析度,搭配 GeForce RTX 40 系列的 DLSS 3 還可帶來最高 4 倍的幀率提升,還可相較原生解析度減少 2 倍的延遲。
目前已經有 35 款遊戲宣布導入 DLSS 3 技術,其中將在 10 月上市的「瘟疫傳說:安魂曲」將搶得首發,而近日由於動畫重新帶動人氣的「 電御叛客 2077 」,以及微軟模擬大作「微軟模擬飛行」皆將支援 DLSS 3 技術。雖然搭配 GeForce RTX 40 才可啟用 DLSS 3 的 Frame Generation 功能,不過舊世代顯示卡仍可開啟 DLSS 3 ,並享受既有的 Super Resolution 超解析度技術。
▲ DLSS 2 僅需單一 AI 模型即可套用到所有遊戲內容,不過開發者需在遊戲啟用或是導入對 DLSS 2 的支援
在 2018 年 NVIDIA 發表代號 Turing 的第一代 GeForce RTX 顯示卡後, NVIDIA 借助架構中的 Tensor Core 帶來的 AI 支援,為遊戲內容開發 DLSS 技術,第一世代的 DLSS 技術需要針對不同的遊戲逐一訓練模型,但隨著 DLSS 發展到第二代的 DLSS 2 ,已可使用單一 AI 模型套用到支援的遊戲引擎,開發者只要使用相容 DLSS 2 的遊戲引擎,開啟項目後即可獲得 DLSS 2 技術支援。
▲ DLSS 3 在 DLSS 2 的技術基礎針對 Ada Lovelace 架構加入新技術
DLSS 3 的 Frame Generation 是針對 Ada Lovelace 架構的新技術,可進一步提升幀數; Ada Lovelace 架構的第四代 Tensor Core 與 RT Core 當中新增的 Optical Flow Accelerator (暫譯:光流加速器)進行最佳化,故無法套用於前兩世代的 GeForce RTX 產品。相較原本的 DLSS 技術的幀產生捲積自動編碼器僅需輸入目前與先前的遊戲幀, DLSS 3 還加入由光流加速器產生的光流場與運動向量與深度等遊戲引擎數據。
Ada Lovelace 的光流加速器可分析兩個連續的遊戲幀運算光流場,光流場捕捉畫素自第一幀移動到第二幀的方向與速度,而光流加速器可捕捉包括粒子、反射、陰影、光罩等不包括遊戲內運動像量計算的像素級資訊,並準確追蹤反射等像素級效果。
▲ DLSS 3 最多可提升 4 倍遊戲幀率
DLSS 3 同時將遊戲引擎的運動向量資料用於精確追蹤場景內幾何體的運動,透過直接導入來自遊戲引擎的資料, DLSS 的 AI 可決定如何使用遊戲運動向量、光流場與連續遊戲幀的資料產生中間幀,借助結合遊戲引擎運動向量與光流進行運動追蹤,使 DLSS 能正確地重建遊戲的幾何效果,藉此產生精確而流暢的遊戲畫面。
在 GeForce RTX 40 系列顯卡即可啟用 DLSS 3 後的 Frame Generation 技術,在第一幀, AI 將透過 DLSS Super Resolution 技術重建第一幀的 3/4 內容,而第二幀則是透過 AI 技術輔以上面提及的技術產生,等同 DLSS Frame Generation 技術將重建兩幀當中高達 7/8 的畫面,藉此減少 GPU 負擔、大幅提升遊戲流暢度;雖然概念類似當前的補幀技術,不過 Frame Generation 並非插入黑幀,而是借助 AI 產生包括光影在內完整的一幀,使畫面更為流暢且理論上不會產生抖動的陰影。此外 DLSS 3 還整合 NVIDIA Reflex 技術,使 CPU 與 GPU 同步,降低遊戲系統的卡頓與輸入延遲,相較原生畫面,啟用 DLSS 還可減少達 2 倍延遲。
▲電御叛客 2077 不僅提升 4 倍效能,同時反應速度提升 2 倍
在即將透過更新支援 DLSS 3 的電御叛客 2077 ( Cyberpunk 2077 )當中,啟用 DLSS3 相較原生解析度可提升 4 倍幀率,並借助 NVIDIA Reflex 使反應時間提升 2 倍。
▲在模擬飛行亦可提升 2 倍的效能
同時 DLSS 3 也能為 CPU 吃重的遊戲帶來相當的效能提升,借助 DLSS 將影像強化轉移到 GPU 執行,例如由於場景龐大的微軟模擬飛行,也可使遊戲幀率提升達 2 倍。