(Noticias de Nanowerk) Los investigadores del programa Machine Common Sense (MCS) de DARPA demostraron una serie de mejoras en el rendimiento de los sistemas robóticos en el transcurso de varios experimentos. Así como los bebés necesitan aprender de la experiencia, MCS intenta construir modelos computacionales que imitan los dominios centrales de la cognición infantil para objetos (física intuitiva), agentes (actores deliberados) y lugares (navegación espacial).
Usando solo entrenamiento simulado, los experimentos recientes de MCS demostraron avances en las capacidades de los sistemas, desde comprender cómo agarrar objetos y adaptarse a los obstáculos hasta cambiar la velocidad/marcha para diferentes objetivos.
«Estos experimentos son hitos importantes que nos acercan a la construcción y despliegue de sistemas robóticos robustos con capacidades de movimiento generalizado», dijo el Dr. Howard Shrobe, gerente del programa MCS en la Oficina de Innovación de la Información de DARPA. «Los sistemas prototipo no requieren grandes conjuntos de sensores para hacer frente a situaciones inesperadas que probablemente ocurran en el mundo real».

Adaptación rápida a terrenos cambiantes
En un experimento, investigadores de la Universidad de California, Berkeley, desarrollaron un algoritmo de adaptación motora rápida (RMA) que permite que los robots de cuatro patas se adapten rápidamente a terrenos cambiantes. Usando el algoritmo RMA y la retroalimentación propioceptiva (el sentido del propio movimiento y la posición del cuerpo), los robots navegaron con éxito a través de una variedad de terrenos reales y simulados.
El algoritmo está completamente entrenado en simulación sin utilizar ningún conocimiento de dominio, como trayectorias de referencia o generadores de trayectoria de pie predefinidos, y se implementa sin ajustes finos. La adaptación del terreno en tiempo real es esencial para que los robots de cuatro patas ayuden a las unidades militares a transportar y capturar cargas.
Soportar cargas dinámicas
Investigadores del estado de Oregón demostraron la capacidad de un robot bípedo para aprender a transportar cargas dinámicas usando solo retroalimentación propioceptiva. Conocido como Cassie, el robot aprendió comportamientos sensibles en un entorno de aprendizaje de simulación a real. Cassie ajustó su modo de andar para tener en cuenta los cambios en la dinámica de la carga, como B. derramar líquidos o equilibrar pesos.
Después del entrenamiento de simulación, Cassie pudo caminar en una cinta rodante durante varios minutos con cuatro tipos diferentes de cargas dinámicas. En contraste, antes del entrenamiento de sentido común que aprendió, Cassie cayó inmediatamente.
Entender cómo agarrar objetos.
En entornos naturales, las personas se encuentran con una amplia variedad de posibles herramientas, variaciones de herramientas y objetos. Esta diversidad es un desafío para los robots. Deben anticipar todas las formas de funcionamiento, por lo que es importante que estén equipados con una habilidad de agarre general en lugar de una habilidad especializada para un conjunto predefinido de objetos.
Investigadores de la Universidad de Utah, como parte del equipo MCS de la Universidad Estatal de Oregón, han desarrollado un algoritmo de aprendizaje de agarre activo que permite a los robots con manos con varios dedos agarrar con destreza objetos previamente invisibles cuando están completamente entrenados en simulación.
El nuevo enfoque permitió al robot capturar objetos novedosos con más del 93 % de éxito en el mundo real, en comparación con el 78 % de los enfoques de aprendizaje pasivo existentes.
Investigación adicional
Otra área técnica dentro de MCS tiene como objetivo desarrollar herramientas informáticas que aprendan leyendo la web, como un bibliotecario de investigación, para construir un depósito de conocimiento de sentido común capaz de usar lenguaje natural y preguntas basadas en imágenes sobre fenómenos de sentido común para responder.
Los investigadores de MCS de la Universidad de Washington y dos equipos del Instituto de Ciencias de la Información de la Universidad del Sur de California están utilizando actualmente una variedad de enfoques, incluido el aprendizaje hiperbólico. Esta técnica aprende la estructura saludable del comportamiento humano y la física a partir de grandes colecciones de videos para predecir acciones humanas hasta 30 segundos en el futuro.
Los investigadores también están construyendo una base de conocimiento simbólico escalable, generada por máquinas, que proporcionará una representación del mundo de mayor calidad, más grande y más diversa. «Al centrarnos en el sentido común, creamos la oportunidad para que los sistemas tengan la flexibilidad del aprendizaje humano y la amplitud del conocimiento humano», dijo Shrobe. «Fusionar este conocimiento con robótica avanzada podría dar como resultado sistemas de misión crítica de alto rendimiento que la gente quiere como socios».