Порівняльна таблиця GP100, GV100, GA100 та GH100[1][2]
Більше інформації GPU features, NVIDIA Tesla P100 ...
GPU features |
NVIDIA Tesla P100 |
NVIDIA Tesla V100 |
NVIDIA A100 |
NVIDIA H100 |
GPU codename |
GP100 |
GV100 |
GA100 |
GH100 |
GPU architecture |
NVIDIA Pascal |
NVIDIA Volta |
NVIDIA Ampere |
NVIDIA Hopper |
Compute capability |
6.0 |
7.0 |
8.0 |
9.0 |
Threads / warp |
32 |
32 |
32 |
32 |
Max warps / SM |
64 |
64 |
64 |
64 |
Max threads / SM |
2048 |
2048 |
2048 |
2048 |
Max thread blocks / SM |
32 |
32 |
32 |
32 |
Max Thread Blocks / Thread Block Clusters |
N/A |
N/A |
N/A |
16 |
Max 32-bit registers / SM |
65536 |
65536 |
65536 |
65536 |
Max registers / block |
65536 |
65536 |
65536 |
65536 |
Max registers / thread |
255 |
255 |
255 |
255 |
Max thread block size |
1024 |
1024 |
1024 |
1024 |
FP32 cores / SM |
64 |
64 |
64 |
128 |
Ratio of SM registers to FP32 cores |
1024 |
1024 |
1024 |
512 |
Shared Memory Size / SM |
64 KB |
Configurable up to 96 KB |
Configurable up to 164 KB |
Configurable up to 228 KB |
Закрити
Матриця порівняння підтримки точності обчислень[3][4]
Більше інформації FP8, FP16 ...
|
Supported CUDA Core Precisions |
Supported Tensor Core Precisions |
FP8 |
FP16 |
FP32 |
FP64 |
INT1 |
INT4 |
INT8 |
TF32 |
BF16 |
FP8 |
FP16 |
FP32 |
FP64 |
INT1 |
INT4 |
INT8 |
TF32 |
BF16 |
NVIDIA Tesla P4 |
Ні | Ні | Так | Так | Ні | Ні | Так | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні |
NVIDIA P100 |
Ні | Так | Так | Так | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні |
NVIDIA Volta |
Ні | Так | Так | Так | Ні | Ні | Так | Ні | Ні | Ні | Так | Ні | Ні | Ні | Ні | Ні | Ні | Ні |
NVIDIA Turing |
Ні | Так | Так | Так | Ні | Ні | Так | Ні | Ні | Ні | Так | Ні | Ні | Так | Так | Так | Ні | Ні |
NVIDIA A100 |
Ні | Так | Так | Так | Ні | Ні | Так | Ні | Так | Ні | Так | Ні | Так | Так | Так | Так | Так | Так |
NVIDIA H100 |
Ні | Так | Так | Так | Ні | Ні | Так | Ні | Так | Так | Так | Ні | Так | Ні | Ні | Так | Так | Так |
Закрити
Позначення:
- FPnn: floating point with nn bits
- INTn: integer with n bits
- INT1: binary
- TF32: TensorFloat32
- BF16: bfloat16
Порівняння потужностей декодування
Більше інформації H.264 decode (1080p30), H.265 (HEVC) decode (1080p30) ...
Відео |
H.264 decode (1080p30) |
H.265 (HEVC) decode (1080p30) |
VP9 decode (1080p30) |
V100 |
16 |
22 |
22 |
A100 |
75 |
157 |
108 |
H100 |
170 |
340 |
260 |
Закрити
Більше інформації JPEG 4:4:4 decode(1080p), JPEG 4:2:0 decode(1080p) ...
Зображення/сек[2] |
JPEG 4:4:4 decode(1080p) |
JPEG 4:2:0 decode(1080p) |
A100 |
1490 |
2950 |
H100 |
3310 |
6350 |
Закрити