Top Qs
Línea de tiempo
Chat
Contexto

AMD Instinct

De Wikipedia, la enciclopedia libre

AMD Instinct
Remove ads

AMD Instinct es la marca de GPU profesionales de AMD.[1][2] Reemplazó la marca FirePro S de AMD en 2016. En comparación con la marca Radeon de productos convencionales para consumidores/jugadores, la línea de productos Instinct está diseñada para acelerar el aprendizaje profundo, las redes neuronales artificiales y las aplicaciones GPGPU / computación de alto rendimiento.

Datos rápidos Información, Tipo ...

La línea de productos Radeon Instinct compite directamente con Ampere e Intel Xeon Phi de Nvidia y las líneas entrantes de Intel Xe de aprendizaje automático y tarjetas GPGPU.

Antes de la presentación del MI100 en noviembre de 2020, la familia Instinct se conocía como AMD Radeon Instinct, AMD eliminó la marca Radeon de su nombre.

Las supercomputadoras basadas en (CPU AMD y) GPU AMD Instinct ahora lideran la lista de supercomputadoras Green500 con más del 50% de ventaja sobre cualquier otra, y encabezan los primeros 4 lugares, incluido el segundo, que es el más rápido del mundo en la actualidad en el Lista TOP500, Frontier.

Remove ads

Productos

Resumir
Contexto

Los tres productos Radeon Instinct iniciales se anunciaron el 12 de diciembre de 2016 y se lanzaron el 20 de junio de 2017, cada uno basado en una arquitectura diferente.[3][4]

MI6

El MI6 es una tarjeta basada en Polaris 10 con refrigeración pasiva con 16 GB de memoria GDDR5 y con un TDP de <150 W.[1][2] A 5,7 TFLOPS (FP16 y FP32), se espera que el MI6 se utilice principalmente para inferencia, en lugar de entrenamiento de redes neuronales. El MI6 tiene un rendimiento informático máximo de doble precisión (FP64) de 358 GFLOPS.[5]

MI8

La MI8 es una tarjeta basada en Fiji, análoga a la R9 Nano, y se espera que tenga un TDP de <175 W.[1] El MI8 tiene 4 GB de memoria de alto ancho de banda. A 8,2 TFLOPS (FP16 y FP32), el MI8 está marcado para la inferencia. El MI8 tiene un rendimiento de cómputo de doble precisión pico (FP64) de 512 GFLOPS.[6]

MI25

La MI25 es una tarjeta basada en Vega que utiliza memoria HBM2. Se espera que el rendimiento del MI25 sea de 12,3 TFLOPS utilizando números FP32. A diferencia del MI6 y el MI8, el MI25 puede aumentar el rendimiento cuando se utilizan números de menor precisión y, en consecuencia, se espera que alcance los 24,6 TFLOPS cuando se utilizan números FP16. El MI25 tiene una potencia nominal de <300 W TDP con refrigeración pasiva. El MI25 también proporciona 768 GFLOPS pico de doble precisión (FP64) a una tasa de 1/16.[7]

Más información Acelerador, Arquitectura ...
Remove ads

Software

ROCm

El siguiente software, a partir de 2022, se reagrupa bajo el metaproyecto Radeon Open Compute.

MXGPU

Los productos MI6, MI8 y MI25 son compatibles con la tecnología de virtualización MxGPU de AMD, lo que permite compartir recursos de GPU entre varios usuarios.[1][8]

MIOpen

MIOpen es la biblioteca de aprendizaje profundo de AMD para permitir la aceleración GPU del aprendizaje profundo.[1] Gran parte de esto amplía el software de la Iniciativa Boltzmann de GPUOpen.[8] Esto tiene la intención de competir con las porciones de aprendizaje profundo de la biblioteca CUDA de Nvidia. Es compatible con los marcos de aprendizaje profundo: Theano, Caffe, TensorFlow, MXNet, Microsoft Cognitive Toolkit, Torch y Chainer. La programación es compatible con OpenCL y Python, además de admitir la compilación de CUDA a través de la interfaz de computación heterogénea para portabilidad y el compilador de computación heterogénea de AMD.

Remove ads

Tabla de chips

Más información Modelo (Nombre en clave), Fecha de lanzamiento ...
Remove ads

Véase también

Remove ads

Notas

  1. los valores turbo (si están disponibles) se indican debajo del valor base en cursiva.
  2. El rendimiento de precisión se calcula a partir de la velocidad del reloj central base (o turbo) en función de una operación FMA.
  3. La tasa de relleno de texturas se calcula como el número de unidades de mapeo de texturas multiplicado por la velocidad del reloj del núcleo base (o turbo).
  4. La tasa de relleno de píxeles se calcula como el número de unidades de salida de renderizado multiplicado por la velocidad de reloj del núcleo base (o turbo).
  5. GCD se refiere a un chip de cálculo de gráficos. Cada GCD es una pieza diferente de silicio
  6. Las tarjetas basadas en CDNA 2.0 adoptan un diseño que utiliza dos troqueles en el mismo paquete. Están vinculadas con un enlace Infinity Fabric bidireccional de 400 GB/s. El sistema host trata los troqueles como GPU individuales.
Remove ads

Referencias

Enlaces externos

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads