Порівняльна таблиця GP100, GV100, GA100 та GH100[1][2]
Більше інформації GPU features, NVIDIA Tesla P100 ...
| GPU features |
NVIDIA Tesla P100 |
NVIDIA Tesla V100 |
NVIDIA A100 |
NVIDIA H100 |
| GPU codename |
GP100 |
GV100 |
GA100 |
GH100 |
| GPU architecture |
NVIDIA Pascal |
NVIDIA Volta |
NVIDIA Ampere |
NVIDIA Hopper |
| Compute capability |
6.0 |
7.0 |
8.0 |
9.0 |
| Threads / warp |
32 |
32 |
32 |
32 |
| Max warps / SM |
64 |
64 |
64 |
64 |
| Max threads / SM |
2048 |
2048 |
2048 |
2048 |
| Max thread blocks / SM |
32 |
32 |
32 |
32 |
| Max Thread Blocks / Thread Block Clusters |
N/A |
N/A |
N/A |
16 |
| Max 32-bit registers / SM |
65536 |
65536 |
65536 |
65536 |
| Max registers / block |
65536 |
65536 |
65536 |
65536 |
| Max registers / thread |
255 |
255 |
255 |
255 |
| Max thread block size |
1024 |
1024 |
1024 |
1024 |
| FP32 cores / SM |
64 |
64 |
64 |
128 |
| Ratio of SM registers to FP32 cores |
1024 |
1024 |
1024 |
512 |
| Shared Memory Size / SM |
64 KB |
Configurable up to 96 KB |
Configurable up to 164 KB |
Configurable up to 228 KB |
Закрити
Матриця порівняння підтримки точності обчислень[3][4]
Більше інформації FP8, FP16 ...
|
Supported CUDA Core Precisions |
Supported Tensor Core Precisions |
| FP8 |
FP16 |
FP32 |
FP64 |
INT1 |
INT4 |
INT8 |
TF32 |
BF16 |
FP8 |
FP16 |
FP32 |
FP64 |
INT1 |
INT4 |
INT8 |
TF32 |
BF16 |
| NVIDIA Tesla P4 |
Ні | Ні | Так | Так | Ні | Ні | Так | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні |
| NVIDIA P100 |
Ні | Так | Так | Так | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні |
| NVIDIA Volta |
Ні | Так | Так | Так | Ні | Ні | Так | Ні | Ні | Ні | Так | Ні | Ні | Ні | Ні | Ні | Ні | Ні |
| NVIDIA Turing |
Ні | Так | Так | Так | Ні | Ні | Так | Ні | Ні | Ні | Так | Ні | Ні | Так | Так | Так | Ні | Ні |
| NVIDIA A100 |
Ні | Так | Так | Так | Ні | Ні | Так | Ні | Так | Ні | Так | Ні | Так | Так | Так | Так | Так | Так |
| NVIDIA H100 |
Ні | Так | Так | Так | Ні | Ні | Так | Ні | Так | Так | Так | Ні | Так | Ні | Ні | Так | Так | Так |
Закрити
Позначення:
- FPnn: floating point with nn bits
- INTn: integer with n bits
- INT1: binary
- TF32: TensorFloat32
- BF16: bfloat16
Порівняння потужностей декодування
Більше інформації H.264 decode (1080p30), H.265 (HEVC) decode (1080p30) ...
| Відео |
H.264 decode (1080p30) |
H.265 (HEVC) decode (1080p30) |
VP9 decode (1080p30) |
| V100 |
16 |
22 |
22 |
| A100 |
75 |
157 |
108 |
| H100 |
170 |
340 |
260 |
Закрити
Більше інформації JPEG 4:4:4 decode(1080p), JPEG 4:2:0 decode(1080p) ...
| Зображення/сек[2] |
JPEG 4:4:4 decode(1080p) |
JPEG 4:2:0 decode(1080p) |
| A100 |
1490 |
2950 |
| H100 |
3310 |
6350 |
Закрити