首頁 電腦 DIY 硬件 RTX 3080 殺手登場 AMD RX 6800 XT

RTX 3080 殺手登場 AMD RX 6800 XT

AMD RX 6800 XT

數今年十大硬件新聞, AMD RX 6000 的登場應佔一席之位; RTX 30 顯示卡珠玉在前,要戰勝 NVIDIA 幾成不可能完成的任務,但 AMD 最終做到了。本文筆者將為大家解構 AMD RDNA2 繪圖架構,分析其成功與不足之處。考慮到早前有報道過 Radeon RX 6000 的新技術,這次將嘗試與 NVIDIA RTX 30 作一次正面的比較,以便讀者能夠了解到兩卡的價值所在。

在讀者角度來看, RX 6000 與 RX 30 顯示卡僅屬於一件產品;在筆者角度,這是 AMD 與 NVIDIA 研發團隊經過無數晝夜苦戰的成果。在 RTX 20 成功發表後, NVIDIA 定出 2X 性能的增長目標,這給予 AMD 團隊莫大的壓力。因為 RDNA 架構( 即 RX 5700/XT )比對手遲半年以上,相當於 AMD 團隊要於 1.5 年時間完成 NVIDIA 團隊 2 年才能完成的目標,為迎難而上, AMD 團隊只好另闢路徑,打出漂亮的一仗,而且 Navi 21 才內建 268 億顆電晶體,竟比 NVIDIA GA102 的 283 億顆電晶體少 15 億顆。

2 × FP32 vs 高時脈

NVIDIA 自上一代 Turing 架構開始支援 INT+FP32 同步運算,以帶來更高的效能。在 Ampere 架構上, NVIDIA 嘗試增加 1 倍 FP32 單元,在同一周期可以執行 2×FP32 ,宣稱等於多一倍 CUDA Core 效能,成為 Ampere 架構的一大賣點,不過也造成 RTX 30 功耗大幅度飆升,不惜採用 3-slot 的巨型散熱器。

RDNA2的Cache架構圖。圖中可見有L0、L1、L2及Infinity Cache,竟比CPU還要豐富。

圖中可見128MB Cache容量為最理想的設計。當中又以HD(1,080p)及1,440p時GPU Cache Hit Rates最高,4K次之。

有別於對手, RDNA2 架構參考了 Zen CPU 的高時脈設計,優化管線設計,使 GPU Boost Clock 增至最高 2,250MHz ,比 RX 5700 XT 1,905MHz 有 345MHz 的增長,個別 AIC 非公板設計甚至更高。

GDDR6X vs 128MB Infinity Cache

曾經, AMD 對高速記憶體情有獨鍾,更率先採用 HBM 記憶體,為此付出更高記憶體成本,目前已主要改用 GDDR6 。 RTX 30 因為運算能力倍增,原來 16Gbps GDDR6 記億體頻寬已捉襟見肘,被迫改用 19/19.5Gbps GDDR6X 記憶體,不但成本略增而且限制了 RTX 3080/3090 的產能。在 RX 6000 上, AMD 充份利用 7nm 製程有利於製作小尺寸 SRAM 的優勢。據 AMD 統計, Zen2 32MB Cache 面積為 27mm² ,相當於 74mm² 總面積的 36.5% 。另一項統計是 128MB Cache 只比 4MB GPU L2 Cache 多 4 倍面積,卻可大大減少資料的讀寫時間,而且不會造成功耗的大幅度上升,成為 RX 6000 高性能的最大秘密。

AMD 以 Infinity Cache + 256-bit GDDR6 跟 384-bit GDDR6 作比較,表示有 2.1 7X 頻寬的增加,而功耗有 10% 的減少。作為對比, NVIDIA 針對 Server 及 Workstation 市場的 A100 GPU 也僅有 40MB L2 Cache 、 RTX 3090 僅為 6MB ,可見 AMD 的進取。

Ray-Tracing Core 的選擇

市場均非常關注 RDNA2 新增的 Ray-Tracing 功能,但 AMD 卻有意淡化 RDNA2 新增 Ray Accelerators 的作用,僅表示比軟件 Ray-Tracing 快 10X 。與 NVIDIA Turing/Ampere 架構每 Streaming Multiprocessor 設 1 組 RT Cores做法相似 , AMD RDNA2 每 Compute Unit 下設 1 組 Ray Accelerator 光線追蹤引擎,以 RX 6800 XT 為例便有 72 組,似乎比 RTX 3080 的 68組 RT Cores 還要強。然而 NVIDIA RT Cores 已發展至第 2 代產品,並且支援與 FP32 一同運算以提升效能,可見 AMD 仍需努力優化 RDNA2 架構。

Ray Accelerator每時脈可執行1 Ray/Triangles Intersection或4 Ray/Box Intersections。

RDNA2 沒有 DLSS 功能嗎?

從架構上來看, RDNA2 似乎沒有 RTX 30 的 Tensor Cores ,也自然沒有後者的 DLSS 功能。 Tensor Cores 原來是 NVIDIA 為了 Tesla 等工作站及數據中心 GPU 而設,至今已發展示第三代產品,可通過 INT4 及 INT8 等低精度運算提升效能,尤其對於 4K 及 8K 遊戲時幫助最大。筆者認為雖然 RX 6000 沒有 NVIDIA Tensor Cores ,但卻支援 INT4 及 INT8 混合精度運算,有機會提供類似 NVIDIA DLSS 功能。

RDNA2架構支援INT8/INT32及INT4/INT32 Mixed Precision Operations for Tensor Math,未來不排除推出類似NVIDIA DLSS之類的技術。

AMD把RX 6000各卡公版尺寸定在267mm長度,不但較RTX 3080/3090小,也有以相當尺寸取代GeForce GTX 1080 Founders Edition等卡的意味。

ASUS ROG Strix LC RX 6800 XT 水冷版解構 

送測的RX 6800 XT 由 ASUS 提供,採用 240mm AIO 水冷+風扇的混合散熱設計。前者主要為 GPU 及 GDDR6 記憶體散熱,而後者則針對 VRM 等供電模組的散熱。

規格

Game Mode Clock︰2,360MHz(Boost Clock)、2,110MHz(Game Clock)
記憶體︰16GB Samsung GDDR6
記憶體速度︰16Gbps
散熱方案︰ 240mm AIO水冷+70mm風扇 2-slot
介面︰PCI-E 4.0 x16
顯示輸出︰2×DisplayPort 1.4a、1×HDMI 2.1、USB Type-C
Power Connector︰2×8-pin PCI-E
建議用火牛︰750W
尺寸︰27.7×13.08×4.36cm(顯示卡)、27.6×12×5.17cm(冷排連風扇)

查詢︰ASUS HK (3582 4770)
售價︰待定

ASUS ROG Strix LC RX 6800 XT水冷版

設有P Mode及Q Mode BIOS供用家作效能及靜音BIOS切換。

AMD公版採用14層PCB,包括4層2oz Copper及15 Power Stage Phases。ASUS也不遑多讓,採用15(GPU)+2/1(GDDR6)相供電。

採用Samsung 16Gbps GDDR6記憶體。

GPU供電採用名廠Infineon XDPE132G5D晶片。

另採用International Rectifier 70A級DrMOS晶片。

Exit mobile version