Top Qs
Línea de tiempo
Chat
Contexto
Ampere (microarquitectura)
De Wikipedia, la enciclopedia libre
Remove ads
Ampere es el nombre en clave de una microarquitectura de unidad de procesamiento de gráficos (GPU) desarrollada por Nvidia como sucesora de las arquitecturas Volta y Turing. Se anunció oficialmente el 14 de mayo de 2020 y lleva el nombre del matemático y físico francés André-Marie Ampère.[1][2]

Nvidia anunció las GPU de consumo de la serie GeForce 30 con arquitectura Ampere en un evento especial de GeForce el 1 de septiembre de 2020.[3][4] Nvidia anunció la GPU A100 de 80 GB en SC20 el 16 de noviembre de 2020.[5] Las tarjetas gráficas Mobile RTX y la RTX 3060 basada en la arquitectura Ampere se revelaron el 12 de enero de 2021.[6]
Nvidia anunció el sucesor de Ampere, Hopper, en GTC 2022 y "Ampere Next Next" para un lanzamiento de 2024 en GPU Technology Conference 2021.
Remove ads
Detalles
Resumir
Contexto
Las mejoras arquitectónicas de la arquitectura Ampere incluyen lo siguiente:
- CUDA Compute Capability 8.0 para A100 y 8.6 para la serie GeForce 30[7]
- Proceso FinFET de 7 nm de TSMC para A100
- Versión personalizada del proceso de 8 nm de Samsung (8N) para la serie GeForce 30[8]
- Núcleos Tensor de tercera generación con compatibilidad con FP16, bfloat16, TensorFloat-32 (TF32) y FP64 y aceleración reducida.[9] Los núcleos Tensor individuales tienen 256 operaciones FP16 FMA por segundo, potencia de procesamiento 4x (solo GA100, 2x en GA10x) en comparación con las generaciones anteriores de Tensor Core; el Tensor Core Count se reduce a uno por SM.
- Núcleos de trazado de rayos de segunda generación; Trazado de rayos, sombreado y cómputo simultáneos para la serie GeForce 30
- Memoria de alto ancho de banda 2 (HBM2) en A100 de 40 GB y A100 de 80 GB
- Memoria GDDR6X para GeForce RTX 3090, RTX 3080 Ti, RTX 3080, RTX 3070 Ti
- Núcleos FP32 dobles por SM en GPU GA10x
- NVLink 3.0 con un rendimiento de 50 Gbit/s por par[9]
- PCI Express 4.0 con soporte SR-IOV (SR-IOV está reservado solo para A100)
- Función de partición de GPU y virtualización de GPU de múltiples instancias (MIG) en A100 que admite hasta siete instancias
- PureVideo conjunto de características K decodificación de video de hardware con decodificación de hardware AV1[10] para la serie GeForce 30 y conjunto de características J para A100
- 5 NVDEC para A100
- Agrega nueva decodificación JPEG de 5 núcleos basada en hardware (NVJPG) con YUV420, YUV422, YUV444, YUV400, RGBA. No debe confundirse con Nvidia NVJPEG (biblioteca acelerada por GPU para codificación/descodificación de JPEG)
Chips
- GA100[11]
- GA102
- GA103
- GA104
- GA106
- GA107
Comparación de la capacidad informática: GP100 vs GV100 vs GA100[12]
Comparación de matriz de soporte de precisión[13][14]
Leyenda:
- FPnn: coma flotante con nn bits
- INTn: entero con n bits
- INT1: binario
- TF32: TensorFloat32
- BF16: bflotador16
Comparación del rendimiento de decodificación
Remove ads
Pastillas Ampere
Remove ads
Acelerador A100 y DGX A100
Resumir
Contexto
El acelerador A100 basado en Ampere se anunció y lanzó el 14 de mayo de 2020.[9] El A100 cuenta con 19,5 teraflops de rendimiento FP32, 6912 núcleos CUDA, 40 GB de memoria gráfica y 1,6 TB/s de ancho de banda de memoria gráfica.[22] Inicialmente, el acelerador A100 solo estaba disponible en la tercera generación del servidor DGX, incluidos 8 A100.[9] El DGX A100 también incluye 15 TB de almacenamiento PCIe gen 4 NVMe,[22] dos CPU AMD Rome 7742 de 64 núcleos, 1 TB de RAM e interconexión HDR InfiniBand con tecnología Mellanox. El precio inicial de la DGX A100 fue de $199 000.[9]
Comparación de aceleradores utilizados en DGX:[23][24][25]
Remove ads
Productos que utilizan Ampere
- Serie GeForce MX
- GeForce MX570 (móvil) (GA107)
- Serie GeForce 20
- GeForce RTX 2050 (móvil) (GA107)
- Serie GeForce 30
- GeForce RTX 3050 (móvil) (GA107)
- GeForce RTX 3050 (GA106 o GA107)[26]
- GeForce RTX 3050 Ti (móvil) (GA107)
- GeForce RTX 3060 (móvil) (GA106)
- GeForce RTX 3060 (GA106 o GA104)[27]
- GeForce RTX 3060 Ti (GA104 o GA103)[28]
- GeForce RTX 3070 (móvil) (GA104)
- GeForce RTX 3070 (GA104)
- GeForce RTX 3070 Ti (móvil) (GA104)
- GeForce RTX 3070 Ti (GA104)
- GeForce RTX 3080 (móvil) (GA104)
- GeForce RTX 3080 (GA102)
- GeForce RTX 3080 12GB (GA102)
- GeForce RTX 3080 Ti (móvil) (GA103)
- GeForce RTX 3080 Ti (GA102)
- GeForce RTX 3090 (GA102)
- GeForce RTX 3090 Ti (GA102)
- GPU Nvidia Workstation (anteriormente Quadro)
- RTX A2000 (móvil) (GA107)
- RTX A2000 (GA106)
- RTX A3000 (móvil) (GA104)
- RTX A4000 (móvil) (GA104)
- RTX A4000 (GA104)
- RTX A4500 (GA102)
- RTX A5000 (móvil) (GA104)
- RTX A5000 (GA102)
- RTX A5500 (GA102)
- RTX A6000 (GA102)
- GPU Nvidia Data Center (anteriormente Tesla)
- Nvidia A2 (GA107)
- Nvidia A10 (GA102)
- Nvidia A16 (4 × GA107)
- Nvidia A30 (GA100)
- Nvidia A40 (GA102)
- Nvidia A100 (GA100)
- Nvidia A100 80 GB (GA100)
Remove ads
Véase también
Referencias
Enlaces externos
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads