Ampere (微架構)
NVIDIA設計的圖形處理單元微架構 来自维基百科,自由的百科全书
安培微架構(Ampere)是NVIDIA於2020年5月發布的一個GPU架構。用以取代圖靈微架構(Turing microarchitecture)。命名為「安培」以向法國物理學家安德烈-馬里·安培(André-Marie Ampère)致敬。Ampere架構擁有電晶體達540億,是三星8nm級晶片。[1]是世界上電晶體最多的晶片,直到後來被蘋果M1 Max擊敗[2]。
![]() | 此條目可參照英語維基百科相應條目來擴充。 (2022年7月21日) |
NVIDIA在 GTC 2022 上宣布了安培微架構的繼任者霍普(Hopper),並在 2021 年 GPU 技術大會上宣布了 2024 年發布的「Ampere Next Next」。
硬體
- DGX A100系統整合8個NVIDIA A100 Tensor Core GPU、有著320GB主記憶體,擁有NVIDIA Mellanox® HDR 200Gbps互連以及5Petaflops 的AI效能。[4]
- DGX SuperPOD是140台DGX A100系統運用MellanoxHDR 200Gbps InfiniBand互連技術組成的一個叢集,AI計算能力達到了700Petaflops。[5]
- NVIDIA EGX™ A100是NVIDIA於2020年5月發布的基於Ampere架構的一款邊緣AI平台。[6]
- NVIDIA GeForce 30系列
- GeForce RTX 3050
- GeForce RTX 3060
- GeForce RTX 3060Ti
- GeForce RTX 3070
- GeForec RTX 3070Ti
- GeForce RTX 3080 10GB
- GeForce RTX 3080 12GB
- GeForce RTX 3080Ti
- GeForce RTX 3090
- GeForce RTX 3090Ti
核心組態
核心代號 | GPC | SM/GPC | 每個SM含有的各類核心 | 製程 | 視訊記憶體支援 | 晶片面積(mm2) | 電晶體數(億個) | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
單精度浮點核心 | 雙精度浮點核心 | 32位元整數核心 | 張量運算核心 | 光線追蹤核心 | 紋理對映單元 | |||||||
GA100 | 8 | 16 | 64 | 32 | 64 | 4 | - | 4 | 台積電 7nm | HBM2 | 826 | 542 |
GA102 | 7 | 12 | 128 | - | 1 | 三星 8nm | GDDR6X | 628 | 283 | |||
GA104 | 4 | GDDR6 | 393 | 174 |
- 在作為計算卡專用的GA100核心中,和其前身一樣,每個SM中安排有32個雙精度浮點核心;在作為非計算卡使用的GA102等核心中,這些雙精度浮點核心被替換為兩倍數量的單精度浮點核心。由於單精度浮點核心事實上作為絕大多數遊戲的流處理器,因此單個SM表觀流處理器數量達到上一代的2倍,RTX 3070的流處理器數量達到近6千個,接近上代旗艦RTX 2080 Ti;但相應的,用單精度浮點核心類比雙精度的效率並不高,因此遊戲顯示卡的雙精度浮點計算速度(主要作用於挖礦和深度學習等應用)相較上代並沒有明顯提升。
- 電晶體密度:GA100使用台積電7nm製程達到約6600萬/mm2,GA102、GA104使用三星8nm製程達到約4500萬/mm2,而上代的圖靈全系列均使用台積電12nm製程,僅達到約2500萬/mm2。
- A100顯示卡中每個SM私有的L1/共享主記憶體容量達到了192KB,相比於前代V100顯示卡的128KB增加了1.5倍。
記錄
2020年7月,根據MLPerf基準測試結果,NVIDIA宣布安培打破16項世界紀錄,包括加速器的八項基準測試和叢集DGX SuperPOD的八項。[7]
參考資料
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.