GeForce RTX 20系列

GeForce RTX 20系列是NVIDIA繼GeForce GTX 10系列之後開發的圖形處理器系列。該系列於2018年8月20日在Gamescom（科隆遊戲展）上發布^[1]^[2]^[3]，首發產品是GeForce RTX 2080及2080Ti^[4]。此系列產品被重新命名為RTX而非沿用已使用多年的GTX，以突顯對光線跟蹤的支援。

快速預覽 發布日期, 代號 ...

Geforce RTX 20 系列
RTX 2080Ti 創始版
發布日期	2018年9月20日，7年前（2018-09-20） 2019年7月9日，6年前（2019-07-09） (Super系列)
代號	TU10x
架構	Turing
產品系列	GeForce RTX
電晶體	108億 12nm(TU106) 136億 12nm(TU104) 186億 12nm(TU102)
製造工藝	台積電 12nm(FinFET)
顯示卡
中階GPU	GeForce RTX 2050 GeForce RTX 2060 GeForce RTX 2060 Super
高端GPU	GeForce RTX 2070 GeForce RTX 2070 Super GeFroce RTX 2080 GeForce RTX 2080 Super
旗艦GPU	GeForce RTX 2080 Ti NVIDIA TITAN RTX
API支援
Direct3D	Direct3D 12 (12_2)
OpenGL	OpenGL 4.6
OpenCL	OpenCL 1.2
Vulkan	Vulkan 1.2
歷史
前代產品	GeForce 10系列
相關產品	GeForce 16系列
後繼產品	GeForce 30系列

Remove ads

架構特性

RTX 20系列基於圖靈微架構（Turing），其主要特點是支援即時光線追蹤（Ray tracing）技術。^[5]該系列顯示卡通過搭載RT（光線追蹤運算）核心，顯著加速了光線追蹤的計算過程。這些核心能夠高效處理四元樹和球形階層，並在碰撞類比的過程中更快地為三角面組成的立體模型進行物體碰撞類比。RT核心的光線追蹤功能在類比反射、折射和陰影的操作上可以取代傳統的使用立方體貼圖或深度貼圖的光柵技術。從光線追蹤運算得到的資訊可以增強陰影使畫面更加逼真，尤其是可以將發生於螢幕畫面以外的動作通過陰影和光線反射渲染到畫面之中。

該系列顯示卡還搭載了張量運算核心（Tensor Core）。張量核心最初是為深度學習任務設計的，例如訓練圖像超解析度模型。然而，消費級顯示卡中的張量核心主要用於進行已經訓練完成的深度學習模型的推理。這些模型的訓練和分析通常在高效能電腦上進行，後者負責確定並最佳化實現特定目標（如圖像超解析度）的方法。之後，消費級顯示卡上的張量核心會使用這些經過高效能電腦訓練獲得的模型，從而實現例如提高圖像解析度等功能，如深度學習超級採樣（DLSS）^[6]。

NVIDIA早在基於帕斯卡和伏打圖形處理微架構的GeForce GTX TITAN系列上就已經在畫面運算中應用了深度學習和光線追蹤技術，但由於當時裝置效能的限制，僅能生成靜態畫面，而GeForce RTX 20系列則首次在畫面處理中大規模採用深度學習技術，並引入了與深度學習相結合的光線追蹤即時動態畫面技術。^[7]

Remove ads

細節

GeForce RTX 20系列採用的台積電12nm FFN製程由伏特微架構使用的12nm FFC製程改進（但本質上依舊是台積電16nm FF+製程的延伸版本），效能是後者的1.1倍，功耗只有後者的70%，核心面積則可以縮小20%
為容納數量龐大的運算單元，GeForce RTX 20系列的核心面積相比帕斯卡微架構大幅增加，由GP102（GeForce GTX 1080Ti）的471mm²增加至TU102（GeForce RTX 2080Ti）的754mm²
GeForce RTX 20系列支援 CUDA 計算能力 7.5
GeForce RTX 20系列採用了全新的SM陣列設計: TPC包含了兩個SM單元(Pascal為1個)，SM單元重新分配為64個FP32、64個INT32、8個Tensor Core 、1個RT Core ，同時添加了獨立的INT數據路徑，支援FP32和INT32操作的並發執行。
為共享暫存、一級暫存、紋理暫存引入了統一架構，一級暫存與共享暫存大小是靈活可變的，可以根據需要在64+32KB或者32+64KB之間變換，讓一級暫存更充分利用資源，也減少一級暫存延遲，並提供比Pascal GPU中使用的一級暫存更高的頻寬，同時二級暫存容量提升。
Tensor Core（張量核心） : 負責人工智慧、神經網路運算，增加了新的INT8和INT4精度模式，FP16半精度也能夠被完整支援通常會用到矩陣融合乘加(FMA)運算，新的INT8精度模式的工作速率是此速率的兩倍，張量核心為矩陣運算提供了顯著的加速，除了新的神經圖形功能外，還用於深度學習訓練和推理操作。
NGX (Neural Graphics Acceleration)框架: 利用張量核心，在遊戲中實現深度學習功能，GeForce Experience會自動匹配Turing顯示卡並且下載可用的NGX Core軟體包，對應如DLSS、AI InPainting、AI Super Rez、AI Slow-Mo等功能。
DLSS (深度學習超級採樣) : 利用張量核心實現在較低的實際解析度下更快地渲染，。
AI InPainting : 利用基於大量真實世界圖像訓練的模型，GeForce RTX 20系列可以補全圖片中缺失的內容、移除相片的噪點、失真部分。
AI Super Rez : GeForce RTX 20系列可以將原始圖像的解析度放大2倍、4倍、8倍，使圖像更加銳利。
AI Slow-Mo : GeForce RTX 20系列可以對常見的30fps的影片進行智慧型補訊框計算，獲得240/480fps的慢動作影片，而不需要專門的高影格率攝影機。
RT Core : 一條專門為光線追蹤計算設計的渲染流水線，用於加速計算邊界體積層次（BVH）遍歷以及光線和三角求交（光線投射）。
支援GDDR6顯示記憶體
附有影像串流壓縮技術（Display Stream Compression，DSC）1.2版的DisplayPort 1.4a
功能集PureVideo的硬體加速視訊解碼
NVLink連接器（與伏打微架構的不相容）
VirtualLink VR
GPU Boost 4^[8]

Remove ads

設計

在RTX的光線追蹤示範程式中使用了微軟的DXR 、NVIDIA的OptiX 以及Vulkan等API來實現光線追蹤功能^[9]。

晶片規格

更多資訊 型號, 推出日期 ...

型號	推出日期	核心代號	製程 (nm)	電晶體數 & 晶粒面積	核心組態				時脈頻率			填充率		顯示記憶體				運算效能 (TFLOPS)				每秒光線數 (十億)	匯流排介面	TDP (W)	NVLink 支援	發售價格(美金)
型號	推出日期	核心代號	製程 (nm)	電晶體數 & 晶粒面積	核心組態 ^{SPs:TMUs:ROPs^[a]}	光追核心	張量核心	二級暫存 (MB)	預設 (MHz)	加速 (MHz)	記憶體 (MT/s)	像素 (GP/s)	材質 (GT/s)	容量 (GB)	頻寬 (GB/s)	類型	介面頻寬 (位元)	單精度 (加速)	雙精度 (加速)	半精度 (加速)	張量浮點	每秒光線數 (十億)	匯流排介面	TDP (W)	NVLink 支援	零售版	創始版
GeForce RTX 2060	2019年 1月15日	TU106- 200A- KA-A1	12	108億 445mm²	1920:120:48 （30 SM）	30	240	3	1365	1680	14000	65.52	163.8	6	336	GDDR6	192	5.24 (6.45)	0.16 (0.20)	10.5 (12.9)	51.6	5	PCIe 3.0 x16	160	否	$349
GeForce RTX 2060 TU104	2020年 1月10日	TU104- 150-KC- A1		136億 545mm²	1920:120:48 （30 SM）	30	240	3	1365	1680		65.52	163.8	6	336		192	5.24 (6.45)	0.16 (0.20)	10.5 (12.9)	51.6	5		160		$300
GeForce RTX 2060 Super	2019年 7月9日	TU106- 410- A1		108億 445mm²	2176:136:64 （34 SM）	34	272	4	1470	1650		90.5	191.4	8	448		256	6.12 (7.18)	0.19 (0.22)	12.2 (14.4)	57.4	6		175		$399
GeForce RTX 2070	2018年 10月17日	TU106- 400-A1			2304:144:64 （36 SM）	36	288		1410	1620		90.24	203.04					6.50 (7.47)	0.20 (0.23)	12.3 (14.9)	59.7					$499	不適用
GeForce RTX 2070	2018年 10月17日	TU106- 400A-A1			2304:144:64 （36 SM）	36	288		1410	1620+		90.24	203.04					6.50 (7.47)	0.20 (0.23)	12.3 (14.9)	59.7					$499+	$599
GeForce RTX 2070 Super	2019年 7月9日	TU104- 410-A1		136億 545mm²	2560:160:64 （40 SM）	40	320		1605	1770		102.72	256.8					8.22 (9.06)	0.26 (0.28)	16.4 (18.1)	72.5	7		215	2路 NVLink	$499
GeForce RTX 2080	2018年 9月20日	TU104- 400-A1			2944:184:64 （46 SM）	46	368		1515	1710		96.96	278.76					8.92 (10.1)	0.28 (0.32)	17.8 (20.1)	80.5	8				$699	不適用
GeForce RTX 2080	2018年 9月20日	TU104- 400A-A1			2944:184:64 （46 SM）	46	368		1515	1710+		96.96	278.76					8.92 (10.1)	0.28 (0.32)	17.8 (20.1)	80.5					$699+	$799
GeForce RTX 2080 Super	2019年 7月23日	TU104- 450-A1			3072:192:64 （48 SM）	48	384		1650	1815	15500	105.6	316.8		496			10.1 (11.2)	0.32 (0.35)	20.3 (22.3)	89.2			250		$699
GeForce RTX 2080 Ti	2018年 9月27日	TU102- 300-K1- A1		186億 754mm²	4352:272:88 （68 SM）	68	544	5.5	1350	1545	14000	118.8	367.2	11	616		352	11.8 (13.4)	0.37 (0.42)	23.5 (26.9)	107.6	10				$999	不適用
GeForce RTX 2080 Ti	2018年 9月27日	TU102- 300A-K1- A1			4352:272:88 （68 SM）	68	544	5.5		1545+		118.8	367.2	11	616		352	11.8 (13.4)	0.37 (0.42)	23.5 (26.9)	107.6	10				$999+	$1,199
NVIDIA Titan RTX	2018年 12月18日	TU102- 400-A1			4608:288:96 （72 SM）	72	576	6		1770		129.6	388.8	24	672		384	12.4 (16.3)	0.39 (0.51)	24.9 (32.6)	130.5	11		280		$2,499

[a]
流處理器數量 : 紋理對映單元數量 : 渲染輸出單元數量

Remove ads

另見

參見

Loading content...

擴充連結

Loading content...

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads