更多

    RTX 3080 殺手登場 AMD RX 6800 XT

    Yeung Chun Fat
    Yeung Chun Fat
    曾經在香港各間主要電腦雜誌工作,隨後轉行到電腦公司任職產品經理,最近重回媒體工作。個人出版的作品包括替香港工業總會轄下香港電子業總會(HKEIC)撰寫《香港電子業穩步向前- 回顧與前瞻》紀念書刊。

    數今年十大硬件新聞, AMD RX 6000 的登場應佔一席之位; RTX 30 顯示卡珠玉在前,要戰勝 NVIDIA 幾成不可能完成的任務,但 AMD 最終做到了。本文筆者將為大家解構 AMD RDNA2 繪圖架構,分析其成功與不足之處。考慮到早前有報道過 Radeon RX 6000 的新技術,這次將嘗試與 NVIDIA RTX 30 作一次正面的比較,以便讀者能夠了解到兩卡的價值所在。

    在讀者角度來看, RX 6000 與 RX 30 顯示卡僅屬於一件產品;在筆者角度,這是 AMD 與 NVIDIA 研發團隊經過無數晝夜苦戰的成果。在 RTX 20 成功發表後, NVIDIA 定出 2X 性能的增長目標,這給予 AMD 團隊莫大的壓力。因為 RDNA 架構( 即 RX 5700/XT )比對手遲半年以上,相當於 AMD 團隊要於 1.5 年時間完成 NVIDIA 團隊 2 年才能完成的目標,為迎難而上, AMD 團隊只好另闢路徑,打出漂亮的一仗,而且 Navi 21 才內建 268 億顆電晶體,竟比 NVIDIA GA102 的 283 億顆電晶體少 15 億顆。

    2 × FP32 vs 高時脈

    NVIDIA 自上一代 Turing 架構開始支援 INT+FP32 同步運算,以帶來更高的效能。在 Ampere 架構上, NVIDIA 嘗試增加 1 倍 FP32 單元,在同一周期可以執行 2×FP32 ,宣稱等於多一倍 CUDA Core 效能,成為 Ampere 架構的一大賣點,不過也造成 RTX 30 功耗大幅度飆升,不惜採用 3-slot 的巨型散熱器。

    RDNA2的Cache架構圖。圖中可見有L0、L1、L2及Infinity Cache,竟比CPU還要豐富。
    RDNA2的Cache架構圖。圖中可見有L0、L1、L2及Infinity Cache,竟比CPU還要豐富。

    圖中可見128MB Cache容量為最理想的設計。當中又以HD(1,080p)及1,440p時GPU Cache Hit Rates最高,4K次之。
    圖中可見128MB Cache容量為最理想的設計。當中又以HD(1,080p)及1,440p時GPU Cache Hit Rates最高,4K次之。

    有別於對手, RDNA2 架構參考了 Zen CPU 的高時脈設計,優化管線設計,使 GPU Boost Clock 增至最高 2,250MHz ,比 RX 5700 XT 1,905MHz 有 345MHz 的增長,個別 AIC 非公板設計甚至更高。

    GDDR6X vs 128MB Infinity Cache

    曾經, AMD 對高速記憶體情有獨鍾,更率先採用 HBM 記憶體,為此付出更高記憶體成本,目前已主要改用 GDDR6 。 RTX 30 因為運算能力倍增,原來 16Gbps GDDR6 記億體頻寬已捉襟見肘,被迫改用 19/19.5Gbps GDDR6X 記憶體,不但成本略增而且限制了 RTX 3080/3090 的產能。在 RX 6000 上, AMD 充份利用 7nm 製程有利於製作小尺寸 SRAM 的優勢。據 AMD 統計, Zen2 32MB Cache 面積為 27mm² ,相當於 74mm² 總面積的 36.5% 。另一項統計是 128MB Cache 只比 4MB GPU L2 Cache 多 4 倍面積,卻可大大減少資料的讀寫時間,而且不會造成功耗的大幅度上升,成為 RX 6000 高性能的最大秘密。

    AMD 以 Infinity Cache + 256-bit GDDR6 跟 384-bit GDDR6 作比較,表示有 2.1 7X 頻寬的增加,而功耗有 10% 的減少。作為對比, NVIDIA 針對 Server 及 Workstation 市場的 A100 GPU 也僅有 40MB L2 Cache 、 RTX 3090 僅為 6MB ,可見 AMD 的進取。

    Ray-Tracing Core 的選擇

    市場均非常關注 RDNA2 新增的 Ray-Tracing 功能,但 AMD 卻有意淡化 RDNA2 新增 Ray Accelerators 的作用,僅表示比軟件 Ray-Tracing 快 10X 。與 NVIDIA Turing/Ampere 架構每 Streaming Multiprocessor 設 1 組 RT Cores做法相似 , AMD RDNA2 每 Compute Unit 下設 1 組 Ray Accelerator 光線追蹤引擎,以 RX 6800 XT 為例便有 72 組,似乎比 RTX 3080 的 68組 RT Cores 還要強。然而 NVIDIA RT Cores 已發展至第 2 代產品,並且支援與 FP32 一同運算以提升效能,可見 AMD 仍需努力優化 RDNA2 架構。

    Ray Accelerator每時脈可執行1 Ray/Triangles Intersection或4 Ray/Box Intersections。
    Ray Accelerator每時脈可執行1 Ray/Triangles Intersection或4 Ray/Box Intersections。

    RDNA2 沒有 DLSS 功能嗎?

    從架構上來看, RDNA2 似乎沒有 RTX 30 的 Tensor Cores ,也自然沒有後者的 DLSS 功能。 Tensor Cores 原來是 NVIDIA 為了 Tesla 等工作站及數據中心 GPU 而設,至今已發展示第三代產品,可通過 INT4 及 INT8 等低精度運算提升效能,尤其對於 4K 及 8K 遊戲時幫助最大。筆者認為雖然 RX 6000 沒有 NVIDIA Tensor Cores ,但卻支援 INT4 及 INT8 混合精度運算,有機會提供類似 NVIDIA DLSS 功能。

    RDNA2架構支援INT8/INT32及INT4/INT32 Mixed Precision Operations for Tensor Math,未來不排除推出類似NVIDIA DLSS之類的技術。
    RDNA2架構支援INT8/INT32及INT4/INT32 Mixed Precision Operations for Tensor Math,未來不排除推出類似NVIDIA DLSS之類的技術。

    AMD把RX 6000各卡公版尺寸定在267mm長度,不但較RTX 3080/3090小,也有以相當尺寸取代GeForce GTX 1080 Founders Edition等卡的意味。
    AMD把RX 6000各卡公版尺寸定在267mm長度,不但較RTX 3080/3090小,也有以相當尺寸取代GeForce GTX 1080 Founders Edition等卡的意味。

    ASUS ROG Strix LC RX 6800 XT 水冷版解構 

    送測的RX 6800 XT 由 ASUS 提供,採用 240mm AIO 水冷+風扇的混合散熱設計。前者主要為 GPU 及 GDDR6 記憶體散熱,而後者則針對 VRM 等供電模組的散熱。

    規格

    Game Mode Clock︰2,360MHz(Boost Clock)、2,110MHz(Game Clock)
    記憶體︰16GB Samsung GDDR6
    記憶體速度︰16Gbps
    散熱方案︰ 240mm AIO水冷+70mm風扇 2-slot
    介面︰PCI-E 4.0 x16
    顯示輸出︰2×DisplayPort 1.4a、1×HDMI 2.1、USB Type-C
    Power Connector︰2×8-pin PCI-E
    建議用火牛︰750W
    尺寸︰27.7×13.08×4.36cm(顯示卡)、27.6×12×5.17cm(冷排連風扇)

    查詢︰ASUS HK (3582 4770)
    售價︰待定

    ASUS ROG Strix LC RX 6800 XT水冷版
    ASUS ROG Strix LC RX 6800 XT水冷版

    設有P Mode及Q Mode BIOS供用家作效能及靜音BIOS切換。
    設有P Mode及Q Mode BIOS供用家作效能及靜音BIOS切換。

    AMD公版採用14層PCB,包括4層2oz Copper及15 Power Stage Phases。ASUS也不遑多讓,採用15(GPU)+2/1(GDDR6)相供電。
    AMD公版採用14層PCB,包括4層2oz Copper及15 Power Stage Phases。ASUS也不遑多讓,採用15(GPU)+2/1(GDDR6)相供電。

    採用Samsung 16Gbps GDDR6記憶體。
    採用Samsung 16Gbps GDDR6記憶體。

    GPU供電採用名廠Infineon XDPE132G5D晶片。
    GPU供電採用名廠Infineon XDPE132G5D晶片。

    另採用International Rectifier 70A級DrMOS晶片。
    另採用International Rectifier 70A級DrMOS晶片。

    您會感興趣的內容

    相關文章