[ad_1]
Las redes neuronales, un tipo de sistema informático inspirado en la organización del cerebro humano, forman la base de muchos sistemas de inteligencia artificial para aplicaciones como el reconocimiento de voz, la visión artificial y el análisis de imágenes médicas.
En el campo de la neurociencia, los investigadores a menudo usan redes neuronales para tratar de modelar los mismos tipos de tareas que realiza el cerebro con la esperanza de que los modelos puedan sugerir nuevas hipótesis sobre cómo el cerebro mismo realiza esas tareas. Sin embargo, un grupo de investigadores del MIT insta a que se tenga más cuidado al interpretar estos modelos.
En un análisis de más de 11 000 redes neuronales que fueron entrenadas para simular la función de las celdas de la cuadrícula (componentes clave del sistema de navegación del cerebro), los investigadores encontraron que las redes neuronales solo generaban actividad similar a la de una cuadrícula cuando se les daban restricciones muy específicas para hacerlo así impuesto no se dan en los sistemas biológicos.
«Esto sugiere que para obtener un resultado utilizando celdas de cuadrícula, los investigadores entrenan los modelos necesarios para hornear esos resultados con decisiones de implementación específicas y biológicamente inverosímiles», dice Rylan Schaeffer, ex investigador principal del MIT.
Sin estas limitaciones, el equipo del MIT descubrió que muy pocas redes neuronales generaban actividad similar a la de las celdas de cuadrícula, lo que sugiere que estos modelos no son necesariamente predictores útiles de cómo funciona el cerebro.
Schaeffer, que ahora estudia informática en la Universidad de Stanford, es el autor principal del nuevo estudio, que se presentará en la Conferencia 2022 sobre sistemas de procesamiento de información neuronal este mes. Ila Fiete, profesora de ciencias del cerebro y cognitivas y miembro del Instituto McGovern para la Investigación del Cerebro del MIT, es la autora principal del artículo. Mikail Khona, estudiante de física en el MIT, también es autor.
Modelado de celdas de cuadrícula
Las redes neuronales, que los investigadores han estado utilizando para una variedad de tareas informáticas durante décadas, consisten en miles o millones de unidades de procesamiento interconectadas. Cada nodo tiene conexiones de intensidad variable con otros nodos de la red. A medida que la red analiza grandes cantidades de datos, la fuerza de estas conexiones cambia a medida que la red aprende a realizar la tarea deseada.
En este estudio, los investigadores se centraron en las redes neuronales diseñadas para imitar la función de las células de la rejilla del cerebro, ubicadas en la corteza entorrinal del cerebro de los mamíferos. Junto con las células de lugar en el hipocampo, las células de rejilla forman un circuito en el cerebro que ayuda a los animales a saber dónde están y cómo navegar a otro lugar.
Se ha demostrado que las celdas de lugar se activan siempre que un animal se encuentra en una ubicación específica, y cada celda de lugar puede responder a más de una ubicación. Las celdas de cuadrícula, por otro lado, funcionan de manera bastante diferente. Cuando un animal se mueve a través de un espacio como una habitación, las celdas de la cuadrícula solo se dispararán si el animal está en uno de los vértices de una cuadrícula triangular. Diferentes conjuntos de celdas de cuadrícula producen cuadrículas de dimensiones ligeramente diferentes que se superponen entre sí. Esto permite que las celdas de la cuadrícula codifiquen una gran cantidad de ubicaciones únicas utilizando una cantidad relativamente pequeña de celdas.
Este tipo de codificación de ubicación también permite predecir la próxima ubicación de un animal en función de un punto de partida y una velocidad determinados. En varios estudios recientes, los investigadores han entrenado redes neuronales para realizar la misma tarea conocida como integración de rutas.
Para entrenar redes neuronales para esta tarea, los investigadores ingresan un punto de partida y una velocidad que cambia con el tiempo. El modelo esencialmente imita la actividad de un animal que deambula por una habitación, calculando posiciones actualizadas a medida que se mueve. A medida que el modelo realiza la tarea, se pueden medir los patrones de actividad de diferentes entidades dentro de la red. La actividad de cada unidad se puede representar como un patrón de activación, similar a los patrones de activación de las neuronas en el cerebro.
En varios estudios anteriores, los investigadores informaron que sus modelos produjeron unidades con patrones de actividad que imitan de cerca los patrones de activación de las celdas de la red. Estos estudios concluyeron que las representaciones similares a celdas de cuadrícula surgirían naturalmente en cualquier red neuronal entrenada para realizar la tarea de integración de rutas.
Sin embargo, los investigadores del MIT llegaron a conclusiones muy diferentes. En un análisis de más de 11 000 redes neuronales que entrenaron para la integración de rutas, descubrieron que, si bien casi el 90 % de ellas aprendieron con éxito la tarea, solo alrededor del 10 % de estas redes generaron patrones de actividad que podrían clasificarse como de cuadrícula. Esto incluye redes en las que incluso un solo dispositivo ha logrado una puntuación de cuadrícula alta.
Según el equipo del MIT, era más probable que los estudios anteriores produjeran una actividad similar a la de las celdas de cuadrícula solo por las limitaciones que los investigadores incorporaron en estos modelos.
«Estudios anteriores han presentado esta historia de que si entrenas redes para integrar vías, obtendrás celdas de cuadrícula. Lo que descubrimos es que, en cambio, tienes que hacer esta larga serie de elecciones de parámetros que sabemos que no coinciden con la biología, y luego obtienes el resultado que deseas en un pequeño subconjunto de esos parámetros», dice Schaeffer.
Más modelos biológicos
Una de las limitaciones encontradas en estudios anteriores fue que los investigadores requerían que el modelo convirtiera la velocidad en una posición única informada por una entidad de red que corresponde a una celda de lugar. Para hacer esto, los investigadores también asumieron que cada celda de lugar corresponde a una sola ubicación, lo que no es el caso de las células de lugar biológicas: los estudios han demostrado que las células de lugar en el hipocampo pueden responder hasta a 20 ubicaciones diferentes, no solo a una.
Cuando el equipo del MIT ajustó los modelos para que las celdas de lugar se parecieran más a las celdas de lugar biológicas, los modelos aún podían realizar la tarea de integración de rutas, pero ya no generaban actividad similar a la de las celdas de cuadrícula. La actividad similar a una celda de cuadrícula también desapareció cuando los investigadores instruyeron a los modelos para generar diferentes tipos de salidas de ubicación, como B. ubicación en una cuadrícula con ejes X e Y o ubicación como distancia y ángulo en relación con un punto de origen.
«Si lo único que le pide a esta red es la integración de rutas y tiene un conjunto de requisitos no fisiológicos muy específicos para la unidad de lectura, entonces es posible obtener celdas de cuadrícula», dice Fiete. «Pero si afloja alguno de estos aspectos de esta unidad de lectura, degrada gravemente la capacidad de la red para producir celdas de cuadrícula. De hecho, por lo general no lo hacen, aunque aún resuelven el problema de integración de rutas».
Entonces, a menos que los investigadores ya supieran sobre la existencia de las celdas de la cuadrícula e instruyeron al modelo para que las creara, sería muy poco probable que ocurrieran como una consecuencia natural del entrenamiento del modelo.
Los investigadores dicen que sus hallazgos sugieren que se necesita más precaución al interpretar los modelos de redes neuronales del cerebro.
“Cuando usa modelos de aprendizaje profundo, pueden ser una herramienta poderosa, pero debe tener mucho cuidado al interpretarlos y determinar si realmente están haciendo predicciones de novo o incluso arrojan luz sobre para qué se está optimizando el cerebro”, dice. Fiete.
Kenneth Harris, profesor de neurociencia cuantitativa en el University College London, espera que el nuevo estudio aliente a los neurocientíficos a ser más cautelosos acerca de lo que pueden mostrar las analogías entre las redes neuronales y el cerebro.
“Las redes neuronales pueden ser una fuente útil para las predicciones. Si desea aprender cómo el cerebro resuelve un cálculo, puede entrenar una red para que lo haga y luego probar la hipótesis de que el cerebro funciona de la misma manera. Ya sea que la hipótesis se confirme o no, aprenderá algo», dice Harris, que no participó en el estudio. «Este documento muestra que la ‘postdicción’ es menos poderosa: las redes neuronales tienen muchos parámetros, por lo que hacer que repliquen un resultado existente no es tan sorprendente».
Cuando estos modelos se utilizan para hacer predicciones sobre cómo funciona el cerebro, es importante tener en cuenta las limitaciones biológicas conocidas y realistas al crear los modelos, dicen los investigadores del MIT. Ahora están trabajando en modelos de celdas de cuadrícula, que esperan proporcionen predicciones más precisas de cómo funcionan las celdas de cuadrícula en el cerebro.
«Los modelos de aprendizaje profundo nos brindan información sobre el cerebro, pero solo después de haber inyectado una gran cantidad de conocimiento biológico en el modelo», dice Khona. «Si usa las restricciones correctas, los modelos pueden brindarle una solución similar a la del cerebro».
La investigación fue financiada por la Oficina de Investigación Naval, la Fundación Nacional de Ciencias, la Fundación Simons a través de la Colaboración Simons sobre el Cerebro Global y el Instituto Médico Howard Hughes a través del Programa de Becarios de la Facultad. Mikail Khona recibió el apoyo de MathWorks Science Fellowship.
[ad_2]