Лучшие вопросы
Таймлайн
Чат
Перспективы
Nvidia DGX
Из Википедии, свободной энциклопедии
Remove ads
NVIDIA DGX — это серия серверов и рабочих станций, разработанная и производимая корпорацией NVIDIA Corporation, которые специализируются на использовании ускорителей GPGPU-вычислений для ускорения приложений глубокого обучения систем искусственного интеллекта.

Модельный ряд
Суммиров вкратце
Перспектива
Поколение Pascal — Volta
Nvidia DGX-1
Первая модель HPC-сервера Nvidia DGX-1 была анонсированная 6 апреля 2016 года[1]. И имела 8 профессиональных карт расширения NVIDIA Tesla P100 / V100 c графическими процессорами класса Server/Datacenter на базе с микроархитектур Pascal или Volta[2] с общей набортной памятью HBM2 объёмом 128 ГБ, подключенных через высокоскоростную шину NVLink[3].
Серия продуктов предназначена для преодоления разрыва между графическими процессорами и ускорителями искусственного интеллекта, поскольку устройство имеет особые как аппаратные так и программные функции, которые позволяют ему ускорять процессы глубокого обучения (частью методов машинного обучения искусственного интеллекта)[4].
Первоначальный DGX-1 на базе микроархитектуры Pascal обеспечивал 170 терафлопс обработки данных половинной точности[5], а модернизация на базе Volta увеличила эту производительность до 1000 терафлопс[6].
Представленный в мае 2017 года Nvidia DGX-1 второго поколения содержит 2 ЦПУ Intel Xeon E5 и 8 GPU Nvidia Tesla V100 на базе микроархитектуры Volta (5120 тензорных ядер), связанных через быструю шину NVLink[7]. Он имеет специализированную архитектуру памяти[англ.], которая является особенно подходящей для построения сетей глубокого обучения[8][9].
- Технические характеристики
- 2 × ЦПУ Intel Xeon E5;
- 512 ГБ OЗУ DDR4-2133;
- 8 × GPU NVIDIA Tesla P100 / V100 с общим объемом HBM2 памяти 128 ГБ;
- 2 × сетевые карты 10 ГБ Ethernet;
- 4 × твердотельных накопителя по 1,92 ТБ;
- 3200 Вт комбинированной мощности источника питания;
- Стоечный корпус 3U.
Nvidia DGX-2
В конце марта 2018 года была продемонстрировано новое поколение HPC-серверов Nvidia DGX-2[10][11] с более высокой производительностью до 2 петафлопс и с использованием новых технологий, такими как NVSwitch[англ.][12].
Nvidia DGX Station
Nvidia DGX Station — это рабочие станции с профессиональными картами расширения NVIDIA Tesla P100 / V100 на базе микроархитектур Pascal или Volta.
Поколение Ampere
Nvidia DGX A100 Server
В мае 2020 года был анонсирован Nvidia DGX A100 Server[13] — это новое поколение HPC-серверов с профессиональными GPGPU-ускорителями NVIDIA A100 на базе микроархитектуры Ampere[14].
- Технические характеристики
DGX A100 Server содержит:
- 2 x ЦПУ 64-ядерные AMD EPYC;
- 2 Тбайт OЗУ;
- 8 × GPU A100 с общим объемом HBM2e памяти 320 или 640 Гб;
- до 10 × 200 Гбит/с InfiniBand/Ethernet-коммутатор ConnectX-7;
- 6 NVIDIA NVSwitch[англ.] пропускная способность 4,8 ТБ/с, что вдвое выше, чем в предыдущем поколении;
- Высокоскоростное хранилище 30 Тбайт NVMe SSD Gen4.
Nvidia DGX Station A100
Nvidia DGX Station A100 — это рабочие станции с профессиональными картами расширения NVIDIA A100 на базе микроархитектуры Ampere.
Поколение Hopper
Nvidia DGX H100 Server
В марте 2022 года был анонсирован Nvidia DGX H100 Server[15] — это очередное поколение HPC-серверов с профессиональными GPGPU-ускорителями NVIDIA H100 на базе микроархитектуры Hopper[16].
- Технические характеристики
DGX H100 Server содержит:
Nvidia DGX GH200 AI Supercomputer
В конце мая 2023 года Nvidia анонсировала, что в конце 2023 года корпоративным заказчикам станет доступна новая HPC-платформа DGX GH200 AI Supercomputer, в которой используются 256 суперчипов GH200 Grace Hopper (72-ядерный ARM-процессор + GPGPU-ускоритель H100), объединённых при помощи технологии NVLink Switch System позволяющей всем ускорителям NVIDIA H100 в составе системы функционировать в качестве единого целого. Производительность этой платформы обещана на уровне 1 Эфлопс (~ 9 Пфлопс FP64), а суммарный объём памяти достигает 144 Тбайт — и это почти в 500 раз больше, чем в одной системе предыдущего поколения Nvidia DGX A100[18][19].
Суперкомпьютеры
Nvidia DGX SuperPod
В октябре 2020 года Nvidia анонсировала для корпоративных предприятий решение NVIDIA DGX SuperPOD — суперкомпьютер который имеет размер кластера от 20 до 140 серверов NVIDIA DGX A100 Server[20][21] или NVIDIA DGX H100 Server[22].
Nvidia DGX Helios
В конце мая 2023 года Nvidia анонсировала построение NVIDIA DGX Helios — суперкомпьютера который с помощью высокоскоростной коммутируемой сети Quantum-2 InfiniBand объединит сразу четыре системы DGX GH200 AI Supercomputer и будет содержать 1024 суперчипа GH200 Grace Hopper (73728 ARM-ядер + 1024 GPGPU-ускорителя H100)[18].
Remove ads
Ускорители
Суммиров вкратце
Перспектива
Сравнение ускорителей, используемых в DGX:[23][24][25]
Remove ads
Примечания
Ссылки
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads