热门问题
时间线
聊天
视角
Ada Lovelace (微架構)
Nvidia設計的圖形處理單元微架構 来自维基百科,自由的百科全书
Remove ads
Ada Lovelace 是Nvidia開發的圖形處理單元(GPU) 微架構,用於取代上一代安培架構,於 2022 年 9 月 20 日正式宣布。架構名稱首次同時包含名字和姓氏,它以英國數學家愛達·勒芙蕾絲 [1]的名字命名,她通常被認為是第一位計算機程式設計師。 Nvidia 同時發布了使用該架構的GeForce 40 系列消費級顯卡 [2]和 RTX 6000 Ada Generation 專業工作站顯卡。 [3]據透露,新的 GPU 使用台積電新的5 納米「4N」工藝,與 Nvidia 用於上一代安培架構的三星8 納米和台積電N7工藝相比,效率更高。 [4]

Remove ads
背景
Nvidia 行政總裁黃仁勛在 2022 年 9 月 20 日的 GTC 2022 主題演講中宣布了 Ada Lovelace 架構,該架構為 Nvidia 的遊戲、工作站和數據中心 GPU 提供動力。 [5]
微架構詳解
Ada Lovelace 架構的架構改進包括以下內容: [6]
每個 SM 單元包含 128 個 CUDA 核心。
Ada Lovelace 採用第三代光追單元。 其中,RTX 4090 具有 128 個光追單元,而上一代 RTX 3090 Ti 為 84 個。這 128 個光追單元可以提供高達 191 TFLOPS 的計算能力,其中每個光追單元 1.49 TFLOPS。 [10] 全新的光線追蹤管線引入了着色器執行重排序 (SER),Nvidia 聲稱它在光追工作負載中能提供 2 倍的性能提升。 [5]
第四代張量核心引入了基於 AI 的 DLSS 3 幀生成技術。Ada Lovelace 中每個 SM 單元包含 4 個張量核心,與上代安培架構非常相似。但是由於包含了更多的 SM 單元,張量核心的總數對比上代有所增加。
Ada Lovelace 架構的核心頻率顯著提高,RTX 4090 的基礎頻率甚至高於 RTX 3090 Ti 的加速 (Boost) 頻率。
完整版的 AD102 核心擁有高達 96 MB 的二級緩存,相比基於安培架構的 GA102 核心,有着十六倍的提升。 [11]相較於那些通過較慢GDDR顯存讀取數據的GPU,新的GPU能夠快速訪問大量二級緩存,這有利於複雜的操作,例如光線追蹤。與此同時,通過減少需要頻繁訪問的重要數據對顯存的依賴,較低位寬的顯存也可以和大容量二級緩存協同工作。
每個內存控制器佔用一個 32 位連接,最高 12 個連接,組合得到內存總線位寬為 384 位。 Ada Lovelace 架構支持GDDR6或GDDR6X顯存。台式機 GeForce RTX 40 系列採用 GDDR6X 顯存,而相應的移動版本和 RTX A6000 工作站 GPU 則使用更節能的 GDDR6 顯存。
與上一代相比,Ada Lovelace 架構能夠使用更低的電壓。 [5] Nvidia 聲稱,RTX 4090 在與上一代旗艦 RTX 3090 Ti 使用相同 450W 功耗的情況下,性能提高了 2 倍。 [12]
能耗比的提升歸功於更先進的製造工藝。 Ada Lovelace 架構採用TSMC為Nvidia定製的頂尖4N工藝製造。上一代安培架構從 2018 年開始使用三星基於 8nm 的8N工藝節點,在該架構推出時已經是兩年前的製造工藝。 [13] [14] 此外,具有 763 億個電晶體的 AD102 晶片,電晶體密度為 1.255 億/mm 2 ,比 GA102 的 4510 萬/mm 2密度增加了 178%。
Ada Lovelace 架構採用了新的第 8 代 Nvidia NVENC視頻編碼器,以及從安培架構沿用下來的第 7 代 NVDEC 視頻解碼器。 [15]
NVENC AV1硬件編碼的加入,使得新架構支持高達 8K 60FPS 10 位色深。與H.264和H.265編解碼器相比,能夠以更低的比特率實現更高的視頻保真度。 [16] Nvidia 聲稱其採用 Ada Lovelace 架構的 NVENC AV1 編碼器比採用安培架構的 H.264 編碼器效率高 40%。 [17]
Ada Lovelace 架構因仍舊使用 32Gbps 的舊 DisplayPort 1.4a,不支持具備更高數據帶寬的DisplayPort 2.0接口而受到批評。 [18]因此,儘管 GPU 的性能能夠達到更高的幀率,但依然會受到 DisplayPort 1.4a 的刷新率限制。反觀同樣於 2022 年 10 月發布的英特爾Arc GPU 卻帶有 DisplayPort 2.0 接口。在 Ada Lovelace 發布的兩個月後, AMD對標的 RDNA 3 架構發布,RDNA 3 甚至支持 DisplayPort 2.1 。[19]
核心參數
基於 Ada Lovelace 架構的產品
- GeForce RTX 40系列
- GeForce RTX 4050(移動端)(AD107)
- GeForce RTX 4060(移動端)(AD107)
- GeForce RTX 4070(移動端)(AD106)
- GeForce RTX 4070 (AD104)
- GeForce RTX 4070 Ti (AD104)
- GeForce RTX 4080(移動端)(AD104)
- GeForce RTX 4080 (AD103)
- GeForce RTX 4090(移動端)(AD103)
- GeForce RTX 4090 (AD102)
- 桌面工作站
- RTX 4000 SFF Ada Generation
- RTX 6000 Ada Generation
- 移動工作站
- RTX 2000 Max-Q Ada Laptop
- RTX 2000 Ada Laptop
- RTX 3000 Ada Laptop
- RTX 3500 Ada Laptop
- RTX 4000 Ada Laptop
- RTX 5000 Ada Laptop
- 數據中心
- L4
- L40
- L40G
- L40 CNX
參考資料
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads