NVIDIA GeForce 20系列 - Wikiwand
For faster navigation, this Iframe is preloading the Wikiwand page for NVIDIA GeForce 20系列.

NVIDIA GeForce 20系列

维基百科,自由的百科全书

此条目需要编修,以确保文法、用词、语气、格式、标点等使用恰当。 (2018年9月7日)请按照校对指引,帮助编辑这个条目。(帮助、讨论)
此条目翻译品质不佳。 (2018年9月7日)翻译者可能不熟悉中文或原文语言,也可能使用了机器翻译,请协助翻译本条目或重新编写,并注意避免翻译腔的问题。明显拙劣的机器翻译请改挂((d|G13))提交删除。
NVIDIA GeForce 20系列
代号 Turing (12nmFFN)
TU102
TU104
TU106
发布日期 2018年
中端GPU RTX 2060(限桌面平台)
RTX 2060 Super(限桌面平台)
高端GPU RTX 2070(限桌面平台)
RTX 2070 Super(限桌面平台)
RTX 2080(限桌面平台)
RTX 2080 Super(限桌面平台)
旗舰GPU RTX 2080 Ti(限桌面平台)
Titan RTX(限桌面平台)
Direct3D版本 Direct3D 12
OpenGL版本 OpenGL 4.5
OpenCL版本 OpenCL 1.2
前代产品 NVIDIA GeForce 10系列
相关产品 NVIDIA GeForce 16系列

NVIDIA GeForce RTX 20系列,是由NVIDIA开发的图形处理器系列。本系列于2018年8月20日的Gamescom(科隆游戏展)上发表,是GeForce GTX 10系列的后续版本。[1][2][3]本系列首发产品是GeForce RTX 2080及2080Ti,2018年9月20日正式发售[4]。此系列产品新命名为RTX,而未沿用推出多年的GTX,以突显支援光线跟踪的特色。

架构特性

RTX 20系列基于图灵微架构(Turing),具有实时光线跟踪(Ray tracing)功能。[5]通过使用RT核心(光线追踪运算核心)可以加速这一过程。这些核心能够高效处理四叉树和球形层次结构,并在碰撞模拟的过程中更快地为三角面组成的立体模型进行物体碰撞模拟。

RT核心的光线追踪功能在模拟反射,折射和阴影的操作上可以取代传统立方体贴图和深度贴图的光栅技术。从光线追踪运算得到的信息可以增强阴影使画面更加逼真,尤其是关于将发生于屏幕画面以外的动作通过阴影和光线反射渲染到画面之中。

张量运算核心(Tensor Core)进一步加速了光线追踪,并用于填充部分渲染图像中的空白,这种技术被称为“降噪”。张量核心原是为深度学习而设计的,例如学习如何提高图像的分辨率。但通常消费者的张量核心主要是执行一些已经完成的深度学习模型,这些模型是在超级计算机进行分析和解决的,超级计算机确定如何实现这些目标的方法,例如学习如何提高图像的分辨率,然后由消费者的张量核心实际使用这个方法,也就是使用超级计算机找到的方法来提高图像的分辨率。

因此,图灵架构的光线跟踪特性,实际上是旧有光线跟踪技术与近年兴起的人工智能(AI)、深度学习结合的产物,先是利用光线跟踪专用的运算单元RT core生成图像的关键要素,剩余的非关键要素则是交由深度学习运算单元Tensor Core来补全,而图像中的关键要素,也借由Tensor Core执行相关的深度学习程式来决定。除此以外,Tensor Core还被用于执行消除混叠的深度学习程式(深度学习超级采样,DLSS),来柔化画面锯齿边缘。[6]

深度学习光线跟踪用于画面运算虽然不是首个,NVIDIA早在基于帕斯卡伏打图形处理微架构的GeForce GTX TITAN系列上有先行铺路,光线跟踪更是早已有之的技术,只是当时装置的效能仅能到作生成静态画面之用,而本代GeForce RTX系列则是首个在画面处理中大量使用深度学习技术、引入与深度学习相结合的光线跟踪实时动态画面技术的图形处理器。不过它仍然保留了效能强劲、规格庞大的传统光栅化渲染3D画面所需的运算组件。[7]

细节

  • 采用台积电12nm FFN工艺打造,由伏打微架构使用的12nm FFC工艺改进(但本质上依旧是台积电16nm FF+工艺的延伸版本),性能是后者的1.1倍,功耗只有后者的70%,核心面积则可以缩小20%
  • 为容纳数量庞大的运算单元,核心面积相比帕斯卡微架构的大幅增加,由GP102(GeForce GTX 1080Ti)的471mm2增加至TU102(GeForce RTX 2080Ti)的754mm2
  • CUDA 7.5
  • 采用全新的SM阵列设计 : TPC包含了两个SM单元(Pascal为1个),SM单元重新分配为64个FP32、64个INT32、8个Tensor Core 、1个RT Core ,同时添加了独立的INT数据路径,支持FP32和INT32操作的并发执行。
  • 为共享缓存、一级缓存、纹理缓存引入了统一架构,一级缓存与共享缓存大小是灵活可变的,可以根据需要在64+32KB或者32+64KB之间变换,让一级缓存更充分利用资源,也减少一级缓存延迟,并提供比Pascal GPU中使用的一级缓存更高的带宽,同时二级缓存容量提升。
  • Tensor Core(张量核心) : 负责人工智能、神经网络运算,增加了新的INT8和INT4精度模式,FP16半精度也能够被完整支持通常会用到矩阵融合乘加(FMA)运算,新的INT8精度模式的工作速率是此速率的两倍,张量核心为矩阵运算提供了显着的加速,除了新的神经图形功能外,还用于深度学习训练和推理操作。
  • NGX (Neural Graphics Acceleration)框架 : 利用张量核心,在游戏中实现深度学习功能,GeForce Experience会自动匹配Turing显卡并且下载可用的NGX Core软件包,对应如DLSS、AI InPainting、AI Super Rez、AI Slow-Mo等功能。
  • DLSS (深度学习超级采样) : 抗锯齿技术,利用张量核心实现在较低的输入样本数下更快地渲染,具有与64×超级采样画面相同质量的细节,还可以避免TAA产生的运动模糊等问题,相比TAA等其它抗锯齿技术,渲染能力得到大幅提升。
  • AI InPainting : 算法利用大量真实世界图像的训练,可以补全图片中缺失的内容,也可以移除照片的噪点、失真部分以及增强照片的清晰度等功能。
  • AI Super Rez : 将原视频的分辨率清晰地放大2倍、4倍、8倍,图像更加锐利。
  • AI Slow-Mo : 将普通常见的30fps进行智能插帧计算,可以获得240/480fps的慢动作视频,而不需要专门高帧率摄像头机。
  • RT Core : 专门为光线追踪计算,是一条特异化的专用流水线,用于加速计算边界体积层次(BVH)遍历以及光线和三角求交(光线投射)。
  • GDDR6显示内存的支援
  • 附有影像串流压缩技术(Display Stream Compression,DSC)1.2版的DisplayPort 1.4a
  • 功能集JPureVideo的硬件加速视讯解码
  • NVLink连接器(与伏打微架构的不相容)
  • VirtualLink VR
  • GPU Boost 4[8]

设计

RTX是GeForce 20系列引入的开发平台。RTX的光线追踪示范程序中使用了微软的DXR,OptiX和Vulkan来进行光线追踪。[9]

芯片规格

此条目目前正依照其他维基百科上的内容进行翻译。 (2018年8月21日)如果您擅长翻译,并清楚本条目的领域,欢迎协助翻译、改善或校对本条目。此外,长期闲置、未翻译或影响阅读的内容可能会被移除。
型号 推出年份 核心代号(s) 制程

(纳米)

核心面积mm2 流处理器 总线

接口

核心配置 二级缓存(MB) 时钟频率配置 填充率 显示存储器配置 运算性能 (GFLOPS) 光线追踪性能 热设计功耗

(W)

NVLink 支持 发售

价格

(美金)

SPs:TMUs:ROPs Tensor core RT core 默认 (MHz) 加速 (MHz) 存储器

(MT/s)

材质

(GT/s)[a]

像素

(GP/s)[b]

容量

(GiB)

带宽 (GB/s) 总线

类型

总线

宽度

(比特)

单精度浮点 (加速) 双精度浮点(加速) 半精度浮点(TFLOPS) Rays/s (Billions) RTX-OPS/s (Trillions) 张量浮点(兆) 零售版 创始版
GeForce RTX 2060[10] 2019年1月15日 TU106-200A-KA-A1 12 445 1920 120 48 30 240 30 3 1365 1680 14000 65.52 163.8 6 336 192 5242 (6451) 164 (202) 10483 (12902) 5 37 51.6 160 $349
GeForce RTX 2060 Super[11][12] 2019年7月9日 TU106-410-A1 2176 136 64 34 272 34 4 1407 1650 90.05 191.4 8 448 256 6123 (7181) 191 (224) 12246 (14362) 6 41 57.4 175 $399
GeForce RTX 2070[13] 2018年10月17日 TU106-400-A1 2304 144 36 288 36 1410 1620 90.24 203.04 6497 (7465) 203 (233) 12994 (14930) 45 59.7 $499 不适用
TU106-410-A1/TU106-400A-A1 1620+ 6497 (7465+) 203 (233+) 12994 (14930+) $499+ $599
GeForce RTX 2070 Super[14][15] 2019年7月9日 TU104-410-A1 12 545 2560 160 40 320 40 1605 1770 102.72 256.8 8218 (9062) 257 (283) 16435 (18125) 7 52 72.5 215 2-way NVLink $499
GeForce RTX 2080[16] 2018年9月20日 TU104-400-A1 2944 184 46 368 46 1515 1710 96.96 278.76 8920 (10068) 279 (315) 17840 (20137) 8 60 80.5 $699 不适用
TU104-410-A1/TU104-400A-A1 1710+ 8920 (10068+) 279 (315+) 17840 (20137+) $699+ $799
GeForce RTX 2080 Super[17][18] 2019年7月23日 TU104-450-A1 3072 192 48 384 48 1650 1815 15500 105.6 316.8 496 10138 (11151) 317 (349) 20275 (22303) 63 89.2 250 $699
GeForce RTX 2080 Ti[19] 2018年9月27日 TU102-300-K1-A1 12 754 4352 272 88 68 544 68 5.5 1350 1545 14000 118.8 367.2 11 616 352 11750 (13448) 367 (421) 23500 (26896) 10 78 107.6 $999 不适用
TU102-300A-K1-A1 1545+ 11750 (13448+) 367 (421+) 23500 (26896+) $999+ $1,199
NVIDIA TITAN RTX[20] 2018年12月18日 TU102-400-A1 4608 288 96 72 576 72 6 1770 129.6 388.8 24 672 384 12442 (16312) 389 (510) 24884 (32625) 11 84 130.5 280 $2,499

另见

参见

  1. ^ GeForce RTX 2080 launch live blog: Nvidia's Gamescom press conference as it happens. TechRadar. [2018-08-21] (英语). 
  2. ^ Nvidia’s new RTX 2080, 2080 Ti video cards ship on Sept 20, starting at $799. Ars Technica. [2018-08-20] (美国英语). 
  3. ^ Nvidia unveils powerful new RTX 2070, RTX 2080, RTX 2080 Ti graphics cards. Polygon. [2018-08-20]. 
  4. ^ Nvidia’s new RTX 2080, 2080 Ti video cards shipped on Sept 20, starting at $799. Ars Technica. [2018-08-20] (美国英语). 
  5. ^ Nvidia announces RTX 2000 GPU series with ‘6 times more performance’ and ray-tracing. The Verge. [2018-08-20]. 
  6. ^ GeForce RTX 2080 即可享受 4K HDR 60FPS 游戏效能,DLSS 反锯齿效能再增加 1 倍. techbang.com. 2018-08-24 (中文(台湾)‎). 
  7. ^ 新增 RT 与 Tensor ,NVIDIA GeForce RTX 2080/2080Ti Turing 架构、Founders Edition、效能表现一次看懂. techbang.com. 2018-09-19 (中文(台湾)‎). 
  8. ^ The NVIDIA Turing GPU Architecture Deep Dive: Prelude to GeForce RTX. AnandTech. 
  9. ^ NVIDIA RTX™ platform. Nvidia. 
  10. ^ NVIDIA GeForce RTX 2060 Graphics Card. NVIDIA. 
  11. ^ Smith, Ryan. The GeForce RTX 2070 Super & RTX 2060 Super Review: Smaller Numbers, Bigger Performance. www.anandtech.com. [2019-07-03]. 
  12. ^ Your Graphics, Now With SUPER Powers. NVIDIA. [2019-07-03] (美国英语). 
  13. ^ NVIDIA GeForce RTX 2070 Graphics Card. NVIDIA. 
  14. ^ Smith, Ryan. The GeForce RTX 2070 Super & RTX 2060 Super Review: Smaller Numbers, Bigger Performance. www.anandtech.com. [2019-07-03]. 
  15. ^ Your Graphics, Now With SUPER Powers. NVIDIA. [2019-07-03] (美国英语). 
  16. ^ NVIDIA GeForce RTX 2080 Founders Edition Graphics Card. NVIDIA. 
  17. ^ Smith, Ryan. The GeForce RTX 2070 Super & RTX 2060 Super Review: Smaller Numbers, Bigger Performance. www.anandtech.com. [2019-07-03]. 
  18. ^ Your Graphics, Now With SUPER Powers. NVIDIA. [2019-07-03] (美国英语). 
  19. ^ Graphics Reinvented: NVIDIA GeForce RTX 2080 Ti Graphics Card. NVIDIA. 
  20. ^ NVIDIA TITAN RTX. NVIDIA. [2018-12-18] (美国英语). 

注释

  1. ^ Texture fillrate is calculated as the number of TMUs multiplied by the base core clock speed.
  2. ^ Pixel fillrate is calculated as the lowest of three numbers: number of ROPs multiplied by the base core clock speed, number of rasterizers multiplied by the number of fragments they can generate per rasterizer multiplied by the base core clock speed, and the number of streaming multiprocessors multiplied by the number of fragments per clock that they can output multiplied by the base clock rate.

扩展链接

{{bottomLinkPreText}} {{bottomLinkText}}
NVIDIA GeForce 20系列
Listen to this article