热门问题
时间线
聊天
视角

GeForce RTX 30系列

来自维基百科,自由的百科全书

GeForce RTX 30系列
Remove ads

GeForce RTX 30系列NVIDIAGeForce RTX 20系列之後開發的圖形處理器系列。於2020年9月1日正式發佈,並於2020年9月17日開始發貨[1]

快速預覽 發布日期, 代號 ...

GeForce 30系列圖形處理器基於安培微架構,擁有第二代光線追蹤核心和第三代張量核心,Nvidia稱其運行效能和能效約為之前圖靈微架構圖形處理器的兩倍[1][2],使用三星電子8奈米工藝製造。

Remove ads

架構特性

在上一代圖靈架構,引入了分數據類型計算的理念,將整數型(INT32)和單精度浮點型(FP32)兩種不同的數據類型交給兩種不同的ALU進行計算,提高了SM單元的並行計算效率。不過現代遊戲應用中最為常見的還是FP 32計算,INT 32 ALU的使用率比FP 32 ALU的低。為提升計算效率,新一代安培架構引入了可同時支援INT 32和FP 32兩種數據類型的新ALU,取代了原本只支援INT 32計算的ALU。也就是說,現在有兩條不同的數據路徑(Datapath),一條能夠處理整數或單精度浮點,另一條只能處理單精度浮點計算。原本整個SM單元同時可以處理64個INT 32計算指令和64個FP 32計算指令,安培上則是變成128個FP 32計算指令或64個INT 32計算指令和64個FP 32計算指令。為配合規模有一定擴張的計算單元,安培SM的共享快取/L1數據快取容量從96KB增長到了128KB,同時其帶寬變為原來的兩倍。

Remove ads

第二代RT Core

安培微架構的RT Core(Ray Tracing core,光線追蹤核心)在圖靈架構的基礎上將三角形求交模組數量增加到兩個(以並行方式運作),在基礎的BVH計算上面,新一代RT Core也能夠快上2倍。同時,第二代RT Core還增加了一個三角形位置內插模組,在允許BVH內的數據做少量更新的情況下,就能實現移動物體運動模糊效果的顯著效能提升。在OptiX 7.0 中,開發人員可以為幾何體指定特定的移動路徑,讓每條射線和時間關聯起來,從而實現移動物體的所有運動模糊效果加速。

第三代Tensor Core

Tensor Core(張量核心)是專門針對深度學習加速設計的矩陣運算單元,可以執行基於深度學習的應用,例如光線追蹤降噪和DLSS抗鋸齒彩現。圖靈中每個SM都配有8個Tensor Core(每個子核有兩個Tensor Core),每個Clock(週期)可以執行512個FP16 Tensor操作。而在安培架構,每個SM裡有4個Tensor Core(每個子核有一個Tensor Core),但是每個Tensor Core的處理能力倍增,因此每個SM也能執行512個FP16 Tensor操作。

第三代Tensor Core引入了BF16、TF32 兩種新的數據格式,並引入硬體稀疏化技術,操作的能力上增加一倍達到等效每週期1024 個FP16 操作。

產品

另見

參考文獻

外部連結

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads