RTX 3080 殺手登場　AMD RX 6800 XT

2020-12-15

數今年十大硬件新聞， AMD RX 6000 的登場應佔一席之位； RTX 30 顯示卡珠玉在前，要戰勝 NVIDIA 幾成不可能完成的任務，但 AMD 最終做到了。本文筆者將為大家解構 AMD RDNA2 繪圖架構，分析其成功與不足之處。考慮到早前有報道過 Radeon RX 6000 的新技術，這次將嘗試與 NVIDIA RTX 30 作一次正面的比較，以便讀者能夠了解到兩卡的價值所在。

在讀者角度來看， RX 6000 與 RX 30 顯示卡僅屬於一件產品；在筆者角度，這是 AMD 與 NVIDIA 研發團隊經過無數晝夜苦戰的成果。在 RTX 20 成功發表後， NVIDIA 定出 2X 性能的增長目標，這給予 AMD 團隊莫大的壓力。因為 RDNA 架構（即 RX 5700/XT ）比對手遲半年以上，相當於 AMD 團隊要於 1.5 年時間完成 NVIDIA 團隊 2 年才能完成的目標，為迎難而上， AMD 團隊只好另闢路徑，打出漂亮的一仗，而且 Navi 21 才內建 268 億顆電晶體，竟比 NVIDIA GA102 的 283 億顆電晶體少 15 億顆。

2 × FP32 vs 高時脈

NVIDIA 自上一代 Turing 架構開始支援 INT+FP32 同步運算，以帶來更高的效能。在 Ampere 架構上， NVIDIA 嘗試增加 1 倍 FP32 單元，在同一周期可以執行 2×FP32 ，宣稱等於多一倍 CUDA Core 效能，成為 Ampere 架構的一大賣點，不過也造成 RTX 30 功耗大幅度飆升，不惜採用 3-slot 的巨型散熱器。

RDNA2的Cache架構圖。圖中可見有L0、L1、L2及Infinity Cache，竟比CPU還要豐富。

圖中可見128MB Cache容量為最理想的設計。當中又以HD（1,080p）及1,440p時GPU Cache Hit Rates最高，4K次之。

有別於對手， RDNA2 架構參考了 Zen CPU 的高時脈設計，優化管線設計，使 GPU Boost Clock 增至最高 2,250MHz ，比 RX 5700 XT 1,905MHz 有 345MHz 的增長，個別 AIC 非公板設計甚至更高。

GDDR6X vs 128MB Infinity Cache

曾經， AMD 對高速記憶體情有獨鍾，更率先採用 HBM 記憶體，為此付出更高記憶體成本，目前已主要改用 GDDR6 。 RTX 30 因為運算能力倍增，原來 16Gbps GDDR6 記億體頻寬已捉襟見肘，被迫改用 19/19.5Gbps GDDR6X 記憶體，不但成本略增而且限制了 RTX 3080/3090 的產能。在 RX 6000 上， AMD 充份利用 7nm 製程有利於製作小尺寸 SRAM 的優勢。據 AMD 統計， Zen2 32MB Cache 面積為 27mm² ，相當於 74mm² 總面積的 36.5% 。另一項統計是 128MB Cache 只比 4MB GPU L2 Cache 多 4 倍面積，卻可大大減少資料的讀寫時間，而且不會造成功耗的大幅度上升，成為 RX 6000 高性能的最大秘密。

AMD 以 Infinity Cache + 256-bit GDDR6 跟 384-bit GDDR6 作比較，表示有 2.1 7X 頻寬的增加，而功耗有 10% 的減少。作為對比， NVIDIA 針對 Server 及 Workstation 市場的 A100 GPU 也僅有 40MB L2 Cache 、 RTX 3090 僅為 6MB ，可見 AMD 的進取。

Ray-Tracing Core 的選擇

市場均非常關注 RDNA2 新增的 Ray-Tracing 功能，但 AMD 卻有意淡化 RDNA2 新增 Ray Accelerators 的作用，僅表示比軟件 Ray-Tracing 快 10X 。與 NVIDIA Turing/Ampere 架構每 Streaming Multiprocessor 設 1 組 RT Cores做法相似， AMD RDNA2 每 Compute Unit 下設 1 組 Ray Accelerator 光線追蹤引擎，以 RX 6800 XT 為例便有 72 組，似乎比 RTX 3080 的 68組 RT Cores 還要強。然而 NVIDIA RT Cores 已發展至第 2 代產品，並且支援與 FP32 一同運算以提升效能，可見 AMD 仍需努力優化 RDNA2 架構。

Ray Accelerator每時脈可執行1 Ray/Triangles Intersection或4 Ray/Box Intersections。

RDNA2 沒有 DLSS 功能嗎？

從架構上來看， RDNA2 似乎沒有 RTX 30 的 Tensor Cores ，也自然沒有後者的 DLSS 功能。 Tensor Cores 原來是 NVIDIA 為了 Tesla 等工作站及數據中心 GPU 而設，至今已發展示第三代產品，可通過 INT4 及 INT8 等低精度運算提升效能，尤其對於 4K 及 8K 遊戲時幫助最大。筆者認為雖然 RX 6000 沒有 NVIDIA Tensor Cores ，但卻支援 INT4 及 INT8 混合精度運算，有機會提供類似 NVIDIA DLSS 功能。

RDNA2架構支援INT8/INT32及INT4/INT32 Mixed Precision Operations for Tensor Math，未來不排除推出類似NVIDIA DLSS之類的技術。

AMD把RX 6000各卡公版尺寸定在267mm長度，不但較RTX 3080/3090小，也有以相當尺寸取代GeForce GTX 1080 Founders Edition等卡的意味。

ASUS ROG Strix LC RX 6800 XT 水冷版解構　

送測的RX 6800 XT 由 ASUS 提供，採用 240mm AIO 水冷+風扇的混合散熱設計。前者主要為 GPU 及 GDDR6 記憶體散熱，而後者則針對 VRM 等供電模組的散熱。

規格

Game Mode Clock︰2,360MHz（Boost Clock）、2,110MHz（Game Clock）
記憶體︰16GB Samsung GDDR6
記憶體速度︰16Gbps
散熱方案︰ 240mm AIO水冷+70mm風扇 2-slot
介面︰PCI-E 4.0 x16
顯示輸出︰2×DisplayPort 1.4a、1×HDMI 2.1、USB Type-C
Power Connector︰2×8-pin PCI-E
建議用火牛︰750W
尺寸︰27.7×13.08×4.36cm（顯示卡）、27.6×12×5.17cm（冷排連風扇）

查詢︰ASUS HK （3582 4770）
售價︰待定