Renesas elogia la nueva MPU Edge AI por su alto rendimiento con bajo consumo de energía

[ad_1]

Renesas lanzó hoy una nueva MPU de 64 bits, la RZ/V2H, que mejora significativamente la familia Renesas RZ/V para IA de vanguardia. Edge AI se refiere al procesamiento de IA que ocurre en el borde de la red conectada. La ventaja la tienen los sistemas de procesamiento integrados y locales, como dispositivos de seguridad, robots domésticos y electrodomésticos. Por el contrario, el procesamiento de IA en la nube se produce en granjas de servidores centrales.

El nuevo RZ/V2H para aplicaciones de IA de vanguardia

La familia de microprocesadores RZ/V de Renesas son todos multinúcleo y están optimizados para el procesamiento de imágenes local. El nuevo RZ/V2H sube la apuesta con núcleos de procesador adicionales, procesamiento más rápido y menor consumo de energía, ofreciendo hasta 80 tera de operaciones por segundo (TOP) en Resnet50, una arquitectura de red neuronal convolucional profunda de 50 capas.

Línea de productos MPU Renesas RZ/V Vision AL de 64 bits

También incluye modelos de clasificación de IA con eficiencias de hasta 10 TOP por vatio. A modo de comparación: las MPU anteriores de la familia alcanzaron valores máximos de 1 TOP y 28 fps con Resnet50.

Hasta 10 núcleos de procesamiento

El RZ/V2H está equipado con un Cortex-A55 de cuatro núcleos, un Cortex-R8 de doble núcleo, un Cortex-M33, un Renesas DRP, un Renesas DRP-AI y, opcionalmente, un procesador de señal de imagen (ISP) de hardware. El A55 normalmente ejecuta Linux para el control y procesamiento general del sistema. El quad-core permite que la MPU admita simultáneamente cuatro cámaras con resolución 4K y hasta 830 fps. Las operaciones en tiempo real, como el control del motor y las comunicaciones, se pueden trasladar al R8. El M33 de 200 MHz maneja tareas en segundo plano, como administración de energía y tareas de activación.

Diagrama de aplicación RZ/V2H.

El ISP de hardware es el primer punto de contacto para los datos de imágenes de las cámaras. Dado que algunas cámaras tienen su propio ISP, Renesas ofrece RX/V2H con o sin gama HW ISP. Finalmente, DRP y DRP-AI brindan compatibilidad con OpenCV y manejan gran parte del procesamiento de IA. Esto crea una opción de procesador increíblemente poderosa para alimentar dispositivos inteligentes para el hogar y la oficina, productos de seguridad industrial y dispositivos de infraestructura. Esto permite que el dispositivo realice operaciones de IA, como reconocimiento de imágenes, identificación y toma de decisiones, sin necesidad de devolver una llamada al servidor para nada más que las operaciones de IA más complejas. Para obtener más información, consulte la hoja de datos de RX/V2H.

Mayor potencia informática, menor consumo de energía

Cuando los paquetes pequeños requieren presupuestos térmicos y de energía bajos, no es suficiente agregar núcleos o aumentar las velocidades de reloj para aumentar el rendimiento mediante la fuerza bruta. El RZ/V2H no defrauda en este sentido. Tiene los núcleos y la velocidad del reloj, pero también utiliza una cuidadosa optimización para aumentar el rendimiento y reducir el consumo de energía.

El procesador dinámico reprogramable (DRP) patentado por Renesas es un motor de procesamiento reconfigurable que se puede personalizar para diferentes tareas. Es lo suficientemente flexible como para cambiar con cada ciclo de reloj si es necesario. En RZ/V2H, el sistema DRP alivia la carga del procesamiento previo y posterior. El DRP adopta compatibilidad con OpenCV, mientras que el DRP-AI optimizado para matemáticas con IA realiza los cálculos de IA más exigentes. Renesas afirma que el V3 es diez veces más eficiente energéticamente que el V2.

Los cálculos matriciales ahora utilizan la cuantificación de datos INT8 en lugar del FP16 utilizado en DRP-AI V2. Cambiar de punto flotante a número entero puede parecer un gran compromiso, pero en esta aplicación no lo es. La MPU utiliza un modelo Resnet50, que garantiza una alta precisión en los datos INT8. Cambiar a INT8 da como resultado un aumento de 14 veces en el rendimiento en matemáticas. Al mismo tiempo, reduce a la mitad la densidad de datos, lo que da como resultado el doble de eficiencia energética que el 16º PM.

Recorte no estructurado en DRP

Un proceso llamado poda no estructurada trae consigo mayores aumentos y reducciones del rendimiento. Un modelo de IA analiza valores ponderados, donde los valores más grandes tienen mayor significado y es más probable que resulten en una coincidencia. Al podar, todos los pesos cercanos a cero se establecen en cero.

FP16 sin recorte en versiones anteriores de MPU (izquierda) e INT8 con poco recorte en el RZ/V2H (derecha).

Dado que el resultado sería cero y no habría ningún valor para el resultado final, el motor de IA de DRP omitirá todas las operaciones con un peso igual a cero. Dejar los pesos cero se llama poda densa, mientras que omitir estos pesos se llama poda dispersa. Esto hace que el modelo de IA sea más pequeño, más rápido y más eficiente, lo que se traduce en una mejora de aproximadamente cinco veces la eficiencia energética, además de la mejora doble al pasar del FP16 al INT8.

Según los puntos de referencia de Renesas, la combinación de INT8 y poda dispersa aumenta significativamente el rendimiento en comparación con las ofertas comunes de la competencia.

Puntos de referencia competitivos que ilustran los beneficios de rendimiento de RZ/V2H

La poda densa ofrece el doble de rendimiento, mientras que la poda escasa aumenta el rendimiento de la IA hasta tres veces. En una aplicación típica donde un dispositivo necesita procesar videos, identificar objetos y tomar decisiones basadas en las observaciones, la velocidad de computación de la IA en el procesador afecta directamente la velocidad de las operaciones del dispositivo. Los robots pueden moverse más rápido, las alarmas pueden activarse más rápidamente y las reacciones necesarias pueden iniciarse antes.

No se requieren fanáticos

DRP y DRP-AI aumentan el rendimiento y reducen significativamente el consumo de energía en comparación con la IA integrada basada en GPU de la competencia. En un caso de uso de robot aspirador, el RZ/V2H ofrece 13 fps para localización y mapeo simultáneos de IA (SLAM) a menos de 4 W, lo que elimina la necesidad de ventiladores de refrigeración en la mayoría de las aplicaciones. Esto significa un funcionamiento más silencioso y una mayor duración de la batería. El RZ/V2H ahora está disponible como componente y placa de desarrollo a través de los canales de ventas estándar de Renesas.

Todas las imágenes utilizadas son cortesía de Renesas.

[ad_2]

Subscribe to Updates

What's Hot