Top Qs
Chronologie
Chat
Contexte
Ampere (microarchitecture)
microarchitecture de carte graphique développée par NVIDIA De Wikipédia, l'encyclopédie libre
Remove ads
Ampere est une microarchitecture de processeur graphique développée par Nvidia pour ses cartes graphiques. Elle succède à la microarchitecture Turing et est sortie en mai 2020.
Remove ads
Caractéristiques
Résumé
Contexte
Les améliorations architecturales de l'architecture Ampere comprennent :
- CUDA Compute Capability 8.0 pour le A100 et 8.6 pour les cartes GeForce 30 series[1] ;
- Procédé 7 nm FinFET de TSMC pour le A100 ;
- Version customisée du procédé 8 nm (8N) de Samsung pour les GeForce 30 series[2] ;
- Troisième génération de cœurs Tensor supportant le FP16, le bfloat16 (en), le TensorFloat-32 (TF32) et le FP64, ainsi que l'accélération du traitement des matrices creuses[3]. Les cœurs Tensor ont, avec 256 opérations FMA FP16 par cycle, 4 fois la puissance de calcul (seulement sur le GA100, 2 fois sur les GA10x) des générations précédentes de cœurs Tensor ; le nombre de cœurs Tensor est de quatre par SM (Streaming Multiprocessor) ;
- Les puces GA10x abritent dans chaque SM, 4 blocs SIMD16 à double voie (FP32 et/ou INT32, 4 autres SIMD16 à voie unique (INT32), 4 blocs SIMD4 pour opérations spéciales (SFU, et 1 ALU unique FP64 partagé par les 4 clusters. Pour la GA100, l'agencement reste identique à la génération précédente (Volta/Turing).
- Deuxième génération de cœurs ray tracing ; ray tracing concurrent, ombrage et compute sur les cartes GeForce 30 ;
- Mémoire HBM2 sur les A100 40 GB & A100 80 GB ;
- Mémoire GDDR6X sur les cartes GeForce RTX 3090, RTX 3080 Ti, RTX 3080, RTX 3070 Ti ;
- NVLink 3.0 avec un débit de 50 Gbit/s par paire[3] ;
- PCI Express 4.0 avec support de SR-IOV (en) (uniquement sur le A100)
- Virtualisation Multi-instance GPU (MIG) avec possibilité de partitionnement du GPU supportant jusqu'à sept instances sur le A100 ;
- Décodage vidéo hardware PureVideo (en) comprenant l'ensemble de caractéristiques K et le décodage hardware de AV1[4] pour les cartes GeForce 30 series et l'ensemble de caractéristiques J pour le A100 ;
- 5 décodeurs vidéo NVDEC (en) pour le A100 ;
- Nouveau décodeur JPEG hardware à 5 cœurs (NVJPG) avec YUV420, YUV422, YUV444, YUV400, RGBA. Il ne doit pas être confondu avec le NVJPEG de Nvidia (bibliothèque accélérée par GPU pour le codage/décodage JPEG).
Puces
- GA100[5]
- GA102
- GA103
- GA104
- GA106
- GA107
Comparaison des capacités de calcul : GP100 vs GV100 vs GA100[13]
Tableau de comparaison des formats numériques supportés[14],[15]
Légende :
- FPnn : virgule flottante avec nn bits
- INTn : entier avec n bits
- INT1 : binaire
- TF32 : TensorFloat32
- BF16 : bfloat16
Comparaison des performances en décodage vidéo
Remove ads
Notes et références
Annexes
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads