更多

    NVIDIA 澄清調整後峰值性能計算方法 RTX 4090 D 不受修訂影響

    Mickey Chan
    Mickey Chan
    愛模擬飛行、希望終有一日回到單車上的宅,眼鏡娘控。座右銘: 1.膽固醇跟美味是成正比的; 2.所有人都可以騙,但絕對不能騙自己; 3.賣掉的貨才是錢,不賣的收藏品不值一文; 4.踩單車,是為了吃更多美食! 5.正義的話語,不一定出自正義之人的口;

    日前美國政府公布晶片出口管制的修訂,並於 4 月 4 日生效。新修訂厚達 166 頁,還提出「調整後峰值性能 (APP)」不得超過 70 加權 TeraFLOPS 上限的要求,不少媒體傳出連 NVIDIA 針對中國市場的 RTX 4090 D 顯示卡和 H20 數據中心加速晶片都受到限制。NVIDIA 隨即聯絡傳媒澄清有關上限的計算方法,表示兩款現時符合規管限制的產品均不受影響。

    據 Tom’s Hardware 引述 NVIDIA 的澄清,指修訂後的規則只針對電腦系統,而並非個別 GPU,更具體來說是針對有記憶體連貫性的系統,如 4 路 DGX H100 系統。而 RTX 4090 D 和 H20 這些已符合規管要求的 GPU 就不受影響。

    另一個重要細節是「調整後峰值性能」適用於 FP64,而且是經過「加權」的,會依據系統使用的是向量還是非向量處理器來進行縮放,向量處理器乘以 0.9,非向量處理器乘以 0.3,所以 FP64 加權效能在 NVIDIA Tensor 核心與 CPU 之下會獲得不同數值。要確定系統的「調整後峰值性能 (APP)」和「加權 TeraFLOPS (WT)」需要計算系統的 FP64 總吞吐量,並按不同類型處理器乘以不同加權值計算出來。

    根據 Tom’s Hardware 報道,RTX 4090 D 在這個計算方法下只有 1.15 加權 TeraFLOPS,所以未有超過 70 加權 TeraFLOPS 上限。

    最新影片

    您會感興趣的內容

    相關文章