热门问题
时间线
聊天
视角

Ada Lovelace (微架構)

Nvidia設計的圖形處理單元微架構 来自维基百科,自由的百科全书

Ada Lovelace (微架构)
Remove ads

Ada LovelaceNvidia開發的圖形處理單元(GPU) 微架構,用於取代上一代安培架構,於 2022 年 9 月 20 日正式宣布。架構名稱首次同時包含名字和姓氏,它以英國數學家愛達·勒芙蕾絲 [1]的名字命名,她通常被認為是第一位計算機程序員。 Nvidia 同時發布了使用該架構的GeForce 40 系列消費級顯卡 [2]和 RTX 6000 Ada Generation 專業工作站顯卡。 [3]據透露,新的 GPU 使用台積電新的5 納米「4N」工藝,與 Nvidia 用於上一代安培架構的三星8 納米和台積電N7工藝相比,效率更高。 [4]

Thumb
艾達·洛夫萊斯
事实速览 發布於, 設計者 ...
Remove ads

背景

Nvidia 首席執行官黃仁勛在 2022 年 9 月 20 日的 GTC 2022 主題演講中宣布了 Ada Lovelace 架構,該架構為 Nvidia 的遊戲、工作站和數據中心 GPU 提供動力。 [5]

微架構詳解

Ada Lovelace 架構的架構改進包括以下內容: [6]

  • CUDA 計算能力(版本) 8.9 [7]
  • 台積電4N 工藝(NVIDIA 定製工藝)- 與台積電N4節點不同
  • 第 4 代 Tensor Cores,支持 FP8、FP16、bfloat16、TensorFloat-32 (TF32) 和稀疏加速
  • 第三代光線追蹤核心,並發光線追蹤,着色與計算
  • 着色器執行重新排序 (SER) [8]
  • 視頻編解碼器(NVENC/NVDEC) 支持 8K 10 Bit 60FPS AV1
  • 不支持NVLink [9]

流處理器 (SM)

CUDA 核心

每個 SM 單元包含 128 個 CUDA 核心。

光線追蹤單元 (RT)

Ada Lovelace 採用第三代光追單元。 其中,RTX 4090 具有 128 個光追單元,而上一代 RTX 3090 Ti 為 84 個。這 128 個光追單元可以提供高達 191 TFLOPS 的計算能力,其中每個光追單元 1.49 TFLOPS。 [10] 全新的光線追蹤管線引入了着色器執行重排序 (SER),Nvidia 聲稱它在光追工作負載中能提供 2 倍的性能提升。 [5]

張量核心 (Tensor)

第四代張量核心引入了基於 AI 的 DLSS 3 幀生成技術。Ada Lovelace 中每個 SM 單元包含 4 個張量核心,與上代安培架構非常相似。但是由於包含了更多的 SM 單元,張量核心的總數對比上代有所增加。

核心頻率

Ada Lovelace 架構的核心頻率顯著提高,RTX 4090 的基礎頻率甚至高於 RTX 3090 Ti 的加速 (Boost) 頻率。

更多信息 RTX 2080 Ti, RTX 3090 Ti ...

緩存與內存

更多信息 RTX 2080 Ti, RTX 3090 Ti ...

完整版的 AD102 核心擁有高達 96 MB 的二級緩存,相比基於安培架構的 GA102 核心,有着十六倍的提升。 [11]相較於那些通過較慢GDDR顯存讀取數據的GPU,新的GPU能夠快速訪問大量二級緩存,這有利於複雜的操作,例如光線追蹤。與此同時,通過減少需要頻繁訪問的重要數據對顯存的依賴,較低位寬的顯存也可以和大容量二級緩存協同工作。

每個內存控制器占用一個 32 位連接,最高 12 個連接,組合得到內存總線位寬為 384 位。 Ada Lovelace 架構支持GDDR6GDDR6X顯存。台式機 GeForce RTX 40 系列採用 GDDR6X 顯存,而相應的移動版本和 RTX A6000 工作站 GPU 則使用更節能的 GDDR6 顯存。

效率和工藝

與上一代相比,Ada Lovelace 架構能夠使用更低的電壓。 [5] Nvidia 聲稱,RTX 4090 在與上一代旗艦 RTX 3090 Ti 使用相同 450W 功耗的情況下,性能提高了 2 倍。 [12]

能耗比的提升歸功於更先進的製造工藝。 Ada Lovelace 架構採用TSMC為Nvidia定製的頂尖4N工藝製造。上一代安培架構從 2018 年開始使用三星基於 8nm 的8N工藝節點,在該架構推出時已經是兩年前的製造工藝。 [13] [14] 此外,具有 763 億個晶體管的 AD102 芯片,晶體管密度為 1.255 億/mm 2 ,比 GA102 的 4510 萬/mm 2密度增加了 178%。

媒體引擎

Ada Lovelace 架構採用了新的第 8 代 Nvidia NVENC視頻編碼器,以及從安培架構沿用下來的第 7 代 NVDEC 視頻解碼器。 [15]

NVENC AV1硬件編碼的加入,使得新架構支持高達 8K 60FPS 10 位色深。與H.264H.265編解碼器相比,能夠以更低的比特率實現更高的視頻保真度。 [16] Nvidia 聲稱其採用 Ada Lovelace 架構的 NVENC AV1 編碼器比採用安培架構的 H.264 編碼器效率高 40%。 [17]

輸出接口

Ada Lovelace 架構因仍舊使用 32Gbps 的舊 DisplayPort 1.4a,不支持具備更高數據帶寬的DisplayPort 2.0接口而受到批評。 [18]因此,儘管 GPU 的性能能夠達到更高的幀率,但依然會受到 DisplayPort 1.4a 的刷新率限制。反觀同樣於 2022 年 10 月發布的英特爾Arc GPU 卻帶有 DisplayPort 2.0 接口。在 Ada Lovelace 發布的兩個月後, AMD對標的 RDNA 3 架構發布,RDNA 3 甚至支持 DisplayPort 2.1[19]

核心參數

更多信息 芯片[20], AD102 [21] ...

基於 Ada Lovelace 架構的產品

消費級

  • GeForce RTX 40系列
    • GeForce RTX 4050(移動端)(AD107)
    • GeForce RTX 4060(移動端)(AD107)
    • GeForce RTX 4070(移動端)(AD106)
    • GeForce RTX 4070 (AD104)
    • GeForce RTX 4070 Ti (AD104)
    • GeForce RTX 4080(移動端)(AD104)
    • GeForce RTX 4080 (AD103)
    • GeForce RTX 4090(移動端)(AD103)
    • GeForce RTX 4090 (AD102)

專業級

  • 桌面工作站
    • RTX 4000 SFF Ada Generation
    • RTX 6000 Ada Generation
  • 移動工作站
    • RTX 2000 Max-Q Ada Laptop
    • RTX 2000 Ada Laptop
    • RTX 3000 Ada Laptop
    • RTX 3500 Ada Laptop
    • RTX 4000 Ada Laptop
    • RTX 5000 Ada Laptop
  • 數據中心
    • L4
    • L40
    • L40G
    • L40 CNX

參考資料

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads