Blackwell 世代來臨,加強 AI 運用表現及帶來 DLSS 4 多重影格生成技術,GF RTX 5090 D 無疑是封頂之選,但多數玩家都難面對它的售價,次一級 US$999 的 GF RTX 5080 才會是真正戰未來的考慮。對比上一代 RTX 4080 Super,新架構的價值如何?
GF RTX 5080 改用另一顆新設計的 GB203 GPU,它保留了 GB202 中的所有主要功能,包括:Blackwell SM 引入的所有新技術,例如 Blackwell 的第四代 RT Core 和第五代 Tensor Core 以及 DLSS 4 和新的 AI 遊戲功能等。完整 GB203 晶片由 456 億個電晶體組成,包含 7 個 GPC、42 個 TPC、84 個 SM 和 8 個 32 位元記憶體控制器(總共 256 位元)。每個 SM 包含 128 個 FP32 CUDA 核心,整個晶片包含 10,752 個 CUDA 核心以及 84 個 RT 核心、336 個 Tensor 核心、336 個紋理單元和 112 個 ROPS。快取記憶體設有 10,752KB L1 快取、21,504KB 暫存器檔案和 65,536KB L2 快取。
對比上代 RTX 4080 及 4080 Super,RTX 5080 核心的電晶體規格只有很微量變化,但當然受惠於 GDDR7 記憶體,可用頻寬就有比較大提升。很視乎新一代架構的效能改進。當然新卡亦會提供第九代 NVENC 編碼器,支援 4:2:2 格式加速。
顯示卡 GF RTX 5080 GF RTX 4080 Super GF RTX 4080 核心代號 GB203 AD103 AD103 製程 TSMC 4N TSMC 4N TSMC 4N 電晶體數目 456 459 459 GPC 數目 7 7 7 CUDA / SP 數目 10,752 10,240 9,728 AI / Tensor 核心數目 336 320 304 RT 核心數目 84 80 76 Texture Unit 數目 336 320 304 ROP 數目 112 112 112 L2 Cache 64MB 64MB 64MB 遊戲時脈 2,617MHz 2,550MHz 2,505MHz 記憶體時脈 30Gbps 23Gbps 22.4Gbps 搭載記憶體 16GB GDDR7 16GB GDDR6X 16GB GDDR6X 記憶體位寬 bit 256 256 256 記憶體頻寬 960 GB/s 736 GB/s 716.8 GB/s 介面 PCI-E 5.0 PCI-E 4.0 PCI-E 4.0 功耗 Watt 360 320 320 首發售價 USD $999 $999 $1,199
【延伸閱讀】 Blackwell 架構細節 【延伸閱讀】 GF RTX 5090 D 顯示卡開箱 【延伸閱讀】 GF RTX 5090 D 效能測試
GF RTX 5080 FE 開箱 雖然中國地區將僅推出 GF RTX 5090 D,但對下其他型號跟國際相同,NVIDIA 提供 GF RTX 5080 Founders Edition,今代包裝設計都有大改變,使用更多環保物料設計,FE 卡提供的 3×8-pin 轉 16-pin 電纜有大改變,線身更為柔軟。
FE 卡提供的 3×8-pin 轉 16-pin 電纜(右上)有大改變,線身更為柔軟。 至於顯示卡亦跟 RTX 5090 FE 一樣,使用全新 Double Flow Through PCB 設計,在背板及顯示卡尾部各有一把約 115mm 風扇及穿透式風道,內有導熱管鰭片。長度及高度跟 RTX 4080 SUPER FE 相若,雙槽闊度符合之前廠商主導的 SFF 高效顯示卡定義,背板提供 3 個 DP 2.1b 及 1 個 HDMI 2.1b 輸出。相信一般 AIC 顯示卡廠商並不會跟隨此複雜高密度的子母 PCB 設計,仍使用傳統單 PCB 及巨大散熱器。
測試平台 處理器:Core i9 14900K 主機板:ROG MAXIMUS Z790 EXTREME 記憶體:32GB DDR5-6000
基本效能 由於 GB203 核心晶圓規格有明顯縮減至跟 AD103 差不多,在《3DMark》可見比 RTX 4080 Super 快約二成作為參考。到實際遊戲表現中,支援光追及路徑追蹤渲染的畫質設定下,舉如《Cyberpunk 2077》及《黑悟空》,原生渲染能力大約有近一成提升,仍是沒法追上 AD102 核心的 RTX 4090。大概要使用到 DLSS 4 的 3X 影格生成,才可以超過 RTX 4090 的 2X 影格生成表現。
DLSS 4 效能 AI、生產力及多媒體編碼 在 AI 及多媒體編碼方面,RTX 5080 轉用 GDDR7 記憶體有提升三成頻寬,對於 AI 文字生成語言模型測試的 LLAMA 模型有比較大提升約二成餘。全新 H.265 4:2:2 編碼加速表現跟 RTX 5090 相同有極高編碼速度,對影片製作流程有大幫助。
至於 FP4 精度生成式圖片,目前尚處於測試階段,使用特製版本 Procyon 才可運行,可以比較 FLUX.1 dev 模型的 FP4 及 FP8 生成速度,在原生 FP4 模式下的確會比較 FP8 有顯著提速效果。其他生成式工具模型正在由社群優化成 FP4 版本,使用此類工具的用家需要花一點時間更新所用的模型。
總結:靠 AI 跑贏大市 GB203 核心的 RTX 5080 沒有改進製程,電晶體數量幾乎和 RTX 4080 Super 相同,但架構效率提升加上 GDDR7 記憶體,仍然令它的渲染表現平均有一成到二成增長,視乎應用環境而定,如 LLAMA 大型語言模型處理就可見近二成提升,而遊戲的光追路徑渲染模式亦有逾一成改善,以新卡的效能增長水平而言算是合理。不過部分舊款傳統渲染技術的遊戲表現增長就稍為有限。
如果在支援 DLSS 4 多重影格生成的遊戲,則 RTX 5080 能夠使用 3x/4x 影格生成去超越 RTX 4090 的 2x 影格生成表現。由於顯示卡上市前的驅動程式並未能對多數 DLSS 3 遊戲進行覆寫,廠商指首發會有 75 款遊戲可使用覆寫功能,因此多重影格生成的支援廣泛程度,將會決定 RTX 5080 的真正價值及對玩家的吸引力。RTX 4080 Super 仍然是一張性能很高的顯示卡,配合有 VRR / G-sync 的顯示器遊戲效果足夠穩定,現有玩家毋須急於升級。如果很想用盡 4K144 顯示器規格,仍在 RTX 30 系列的玩家就肯定升級有感。
延伸閱讀