GeForce RTX 30系列

GeForce RTX 30系列
GeForce RTX 3090 創始版
發布日期	2020年9月17日，5年前（2020-09-17）
代號	GA10x
架構	Ampere
產品系列	GeForce RTX
電晶體	133億 (GA106) 174億 (GA104) 283億 (GA102)
製造工藝	三星 8nm
顯示卡
中階GPU	GeForce RTX 3050 GeForce RTX 3060 GeForce RTX 3060Ti 行動平台： RTX 3050 RTX 3050Ti RTX 3060
高端GPU	GeForce RTX 3070 GeForce RTX 3070Ti GeForce RTX 3080 GeForce RTX 3080Ti 行動平台： RTX 3070 RTX 3070Ti RTX 3080 RTX 3080Ti
旗艦GPU	GeForce RTX 3090 GeForce RTX 3090Ti
API支援
Direct3D	Direct3D 12 Ultimate（12_2）
OpenGL	OpenGL 4.6
OpenCL	OpenCL 3.0
Vulkan	Vulkan 1.3
歷史
前代產品	NVIDIA GeForce 20系列
後繼產品	NVIDIA GeForce 40系列

架構特性

在上一代圖靈架構，引入了分數據類型計算的理念，將整數型（INT32）和單精度浮點型（FP32）兩種不同的數據類型交給兩種不同的ALU進行計算，提高了SM單元的並行計算效率。不過現代遊戲應用中最為常見的還是FP 32計算，INT 32 ALU的使用率比FP 32 ALU的低。為提升計算效率，新一代安培架構引入了可同時支援INT 32和FP 32兩種數據類型的新ALU，取代了原本只支援INT 32計算的ALU。也就是說，現在有兩條不同的數據路徑（Datapath），一條能夠處理整數或單精度浮點，另一條只能處理單精度浮點計算。原本整個SM單元同時可以處理64個INT 32計算指令和64個FP 32計算指令，安培上則是變成128個FP 32計算指令或64個INT 32計算指令和64個FP 32計算指令。為配合規模有一定擴張的計算單元，安培SM的共享快取/L1數據快取容量從96KB增長到了128KB，同時其帶寬變為原來的兩倍。

Remove ads

第二代RT Core

安培微架構的RT Core(Ray Tracing core,光線追蹤核心)在圖靈架構的基礎上將三角形求交模組數量增加到兩個（以並行方式運作），在基礎的BVH計算上面，新一代RT Core也能夠快上2倍。同時，第二代RT Core還增加了一個三角形位置內插模組，在允許BVH內的數據做少量更新的情況下，就能實現移動物體運動模糊效果的顯著效能提升。在OptiX 7.0 中，開發人員可以為幾何體指定特定的移動路徑，讓每條射線和時間關聯起來，從而實現移動物體的所有運動模糊效果加速。

第三代Tensor Core

Tensor Core(張量核心)是專門針對深度學習加速設計的矩陣運算單元，可以執行基於深度學習的應用，例如光線追蹤降噪和DLSS抗鋸齒渲染。圖靈中每個SM都配有8個Tensor Core(每個子核有兩個Tensor Core)，每個Clock(週期)可以執行512個FP16 Tensor操作。而在安培架構，每個SM裡有4個Tensor Core（每個子核有一個Tensor Core），但是每個Tensor Core的處理能力倍增，因此每個SM也能執行512個FP16 Tensor操作。

第三代Tensor Core引入了BF16、TF32 兩種新的數據格式，並引入硬體稀疏化技術，操作的能力上增加一倍達到等效每週期1024 個FP16 操作。

產品

更多資訊 型號, 推出日期 ...

型號	推出日期	核心代號	製程	電晶體數 & 晶粒面積	核心組態^[a]	二級暫存(MB)	時脈頻率			顯示記憶體				填充率		運算效能 (TFLOPS)					匯流排介面	TDP (W)	NVLink支援	發售價格 (美金)
型號	推出日期	核心代號	製程	電晶體數 & 晶粒面積	核心組態^[a]	二級暫存(MB)	預設 (MHz)	加速 (MHz)	記憶體 (MT/s)	容量 (GiB)	頻寬 (GB/s)	類型	介面頻寬 (bit)	像素 (GP/s)	材質 (GT/s)	單精度	雙精度	半精度	張量 (FP16)	光追	匯流排介面	TDP (W)	NVLink支援	發售價格 (美金)
GeForce RTX 3050	2022年1月27日	GA106-150-KA-A1	三星 8N	133億 276mm²	2560:80:32:80:28 (20) (3)	2	1552	1777	14000	8	224	GDDR6	128	49.6 56.86	124.1 142.2	7.946 9.098	0.124 0.142	7.946 9.098			PCIe 4.0 x8	130	否	$249
GeForce RTX 3060^[3]	2021年 2月25日	GA106-300-A1		133億 276mm²	3584:112:48:112:28 (28) (3)	3	1320		15000	12	360.0		192	63.4 85.3	147.8 199.0	9.46 12.74	0.148 0.199	9.46 12.74		25	PCIe 4.0 x16	170		$329
GeForce RTX 3060^[3]	2021年 9月1日	GA104-150-A1^[4]		174億 392.5mm²	3584:112:48:112:28 (28) (3)	3	1320		15000	12	360.0		192	63.4 85.3	147.8 199.0	9.46 12.74	0.148 0.199	9.46 12.74		25		170		$329
GeForce RTX 3060 Ti^[5]	2020年 12月2日	GA104-200-A1			4864:152:80:152:38 (38) (6)	4	1410	1665	14000	8	448.0		256	112.8 133.2	214.3 253.1	13.72 16.20	0.214 0.253	13.70 16.20	? 129.6	32		200		$399
GeForce RTX 3070^[6]	2020年 10月29日^[7]	GA104-300-A1			5888:184:96:184:46 (46) (6)		1500	1725	14000		448.0			144.0 165.6	276.0 317.4	17.66 20.31	0.276 0.318	17.66 20.37	141.31 162.98	40^[8]		220		$499
GeForce RTX 3070 Ti^[9]	2021年 6月10日	GA104-400-A1			6144:192:96:192:48 (48) (6)		1575	1770	9500 (19000)^[b]		608.3	GDDR6X		151.18 169.9	302.36 339.8	19.35 21.75	0.302 0.340	19.35 21.75				290		$599
GeForce RTX 3080^[10]	2020年 9月17日	GA102-200-KD-A1		283億 628.4mm²	8704:272:96:272:68 (68) (7)	5	1440	1710		10	760.0		320	138.2 164.2	391.68 465.12	25.07 29.77	0.392 0.465	25.06 29.76	200.54 238.14	58		320		$699
GeForce RTX 3080 Ti^[11]	2021年 6月3日	GA102-225-A1			10240:320:112:320:80 (80) (7)	6	1395	1665		12	912.4		384	153.5 186.5	438.5 532.8	28.57 34.71	0.438 0.533	28.06 34.10				350		$1199
GeForce RTX 3090^[12]	2020年 9月24日	GA102-300-A1			10496:328:112:328:82 (82) (7)		1395	1695	9750 (19500)^[b]	24	935.8			156.2 189.8	457.6 555.96	29.28 35.58	0.459 0.558	29.38 35.68	235.08 285.48	69^[8]		350	2路 NVLink	$1499
GeForce RTX 3090 Ti^[13]	2022年 3月22日	GA102-350-A1			10752:336:112:336:84 (84)(7)		1560	1860	10500 (21000)	24	1008			174.7 208.3	524.1 625.0	33.54 39.99	0.524 0.625	33.54 39.99	320			450	2路 NVLink	$1999

[a]
流處理器數量：紋理對映單元數量：渲染輸出單元數量：張量核心數量：光線追蹤核心數量（SM數量）（GPC數量）。面向非專業用途的Ampere架構中每個GPC由16個ROP及最多12個SM組成，每個SM固定包括128個流處理器（單精度浮點處理器）、64個32位元長整型處理器、4個TMU、4個張量核心和1個光線追蹤核心；GA100核心的浮點處理器組態則略有不同，參見NVIDIA Tesla
[b]
類似於早已在快閃記憶體行業應用的MLC技術，GDDR6X一次存取可以操作兩個位元，括號內用於比較GDDR6的等效傳輸速率

Remove ads

GeForce RTX 30系列

架構特性

第二代RT Core

第三代Tensor Core

產品

另見

參考文獻

外部連結

Wikiwand - on