[ad_1]
Los dispositivos 3D RRAM de cómputo en memoria ejecutan modelos complejos basados en CNN de manera más eficiente, lo que permite mejores precisiones y rendimiento.
Las arquitecturas de aprendizaje automático se están volviendo cada vez más complejas y computacionalmente intensivas. Aunque las arquitecturas de aprendizaje automático basadas en redes neuronales convolucionales (CNN) han demostrado ser extremadamente valiosas en una variedad de aplicaciones como la visión por computadora, el procesamiento de imágenes y la generación de lenguaje humano, no se pueden aplicar a un nivel específico de tareas complejas.
Investigadores de la Academia de Ciencias de China, Instituto de Tecnología de Beijing, desarrollaron recientemente un nuevo sistema de computación en memoria que podría ayudar a ejecutar modelos más complejos basados en CNN de manera más efectiva. Este nuevo dispositivo de memoria se basa en macros de cómputo en memoria no volátiles de matrices de memristores 3D.
Las memorias resistivas de acceso aleatorio, o RRAM, son dispositivos de memoria no volátiles (es decir, que retienen datos incluso después de cortes de energía) basados en memristores. Los memristores se utilizan para limitar o regular el flujo de corrientes eléctricas en un circuito mientras detectan el flujo de carga que ha fluido previamente a través de ellos.
Incrustar los cálculos en la memoria puede reducir en gran medida la transferencia de datos entre las memorias y los procesadores, lo que en última instancia mejora la eficiencia energética general del sistema.
Desarrollado por Qiang Huo y sus colegas, este dispositivo de computación en memoria es una RRAM 3D con capas apiladas verticalmente y circuitos periféricos. El circuito del dispositivo está hecho con tecnología CMOS de 55nm.
Los investigadores evaluaron su dispositivo para ejecutar un modelo para detectar bordes en escáneres cerebrales de MRI». Nuestra macro puede realizar operaciones de multiplicación de matrices vectoriales 3D con una eficiencia energética de 8,32 teraoperaciones por segundo por vatio cuando los datos de entrada, peso y salida son 8,9 y 22 bits, respectivamente, y la densidad de bits es de 58,2 bits µm–2”, escriben los investigadores en su artículo. «Demostramos que la macro proporciona una detección de bordes cerebrales de resonancia magnética más precisa y una precisión de inferencia mejorada en el conjunto de datos CIFAR-10 que los métodos convencionales».
En el futuro, podría resultar extremadamente valioso ejecutar modelos complejos basados en CNN con mayor eficiencia energética y al mismo tiempo permitir mejores precisiones y rendimiento.
Referencias: Qiang Huo et al, Una macro de computación en memoria basada en una memoria de acceso aleatorio resistiva tridimensional, naturaleza electronica (2022).
DOI: 10.1038/s41928-022-00795-x
[ad_2]