[ad_1]
(noticias nanowerk) Un investigador acaba de terminar de escribir un artículo científico. Sabe que su trabajo podría beneficiarse desde una perspectiva diferente. ¿Se perdió algo? O tal vez haya una aplicación de su investigación en la que aún no había pensado. Un segundo par de ojos sería fantástico, pero es posible que incluso el empleado más amigable no pueda tomarse el tiempo para leer todas las publicaciones de antecedentes necesarias para mantenerse actualizado.
Kevin Yager, líder del grupo de nanomateriales electrónicos en el Centro de Nanomateriales Funcionales (CFN), una instalación para usuarios de la Oficina de Ciencias del Departamento de Energía (DOE) de EE. UU. en el Laboratorio Nacional Brookhaven del DOE, imaginó cómo los recientes avances en inteligencia artificial (IA) y máquinas El aprendizaje (ML) podría apoyar la lluvia de ideas científica y la generación de ideas. Para lograrlo desarrolló un chatbot que tiene conocimientos de las ciencias en las que se desempeña.
Los rápidos avances en IA y ML han dado paso a programas que pueden generar textos creativos y códigos de software útiles. Estos chatbots de uso general han estado atrayendo la atención del público recientemente. Los chatbots existentes basados en modelos lingüísticos grandes y diversos carecen de conocimientos detallados de los subdominios científicos. Al aprovechar un método de recuperación de documentos, el robot de Yager tiene conocimientos de áreas de la ciencia de los nanomateriales que otros robots no tienen.
Los detalles de este proyecto y cómo otros científicos pueden utilizar esta colega de IA en su propio trabajo se publicaron recientemente en Descubrimiento digital (“Chatbots de dominio específico para ciencia con incrustaciones”).
El ascenso de los robots
“CFN lleva mucho tiempo buscando nuevas formas de utilizar la IA/ML para acelerar el descubrimiento de nanomateriales. Actualmente, nos ayuda a identificar, catalogar y seleccionar muestras rápidamente, automatizar experimentos, controlar dispositivos y descubrir nuevos materiales. Esther Tsai, científica del Grupo de Nanomateriales Electrónicos de CFN, está desarrollando un compañero de IA para acelerar los experimentos de ciencia de materiales en la Fuente Nacional de Luz Sincrotrón II (NSLS-II), otra instalación de usuario de la Oficina de Ciencias del DOE en Brookhaven Lab.
Se ha trabajado mucho en CFN sobre IA/ML, lo que puede ayudar a impulsar experimentos mediante el uso de automatización, control, robótica y análisis, pero tener un programa que se sienta cómodo con textos científicos es algo que los investigadores aún no han hecho. había explorado tan profundamente. La capacidad de documentar, comprender y comunicar rápidamente información sobre un experimento puede resultar útil de muchas maneras, desde romper las barreras del idioma hasta ahorrar tiempo al consolidar pasos más importantes.
Cuida tu idioma
Para crear un chatbot especial, el programa necesitaba un texto específico del dominio, un lenguaje de áreas en las que el bot debería centrarse. En este caso los textos son publicaciones científicas. El texto de dominio específico ayuda al modelo de IA a comprender nueva terminología y definiciones y le presenta conceptos científicos innovadores. Lo más importante es que este conjunto de documentos seleccionados permite que el modelo de IA base su razonamiento en hechos confiables.
Para emular el lenguaje humano natural, los modelos de IA se entrenan en textos existentes, lo que les permite aprender la estructura del lenguaje, memorizar diversos hechos y desarrollar una forma primitiva de pensar. En lugar de reentrenar laboriosamente el modelo de IA utilizando textos de nanociencia, Yager le dio la capacidad de buscar información relevante en un conjunto seleccionado de publicaciones. Proporcionar una biblioteca de datos relevantes fue sólo la mitad de la batalla. Para utilizar este texto de forma precisa y eficaz, el robot necesitaría una forma de descifrar el contexto correcto.
«Un desafío común con los modelos de lenguaje es que a veces ‘alucinan’ cosas que suenan plausibles pero no son ciertas», explicó Yager. “Este era un problema clave a resolver para un chatbot utilizado en investigación, a diferencia de un chatbot que escribe poesía, por ejemplo. No queremos que se inventen hechos o citas. Era necesario abordar esto. La solución a esto fue algo que llamamos «incrustación», una forma de categorizar y vincular rápidamente información entre bastidores».
La incrustación es un proceso que convierte palabras y frases en valores numéricos. El «vector de incrustación» resultante cuantifica el significado del texto. Cuando un usuario hace una pregunta al chatbot, también se envía al modelo de incrustación de ML para calcular su valor vectorial. Este vector se utiliza para buscar en una base de datos precalculada de fragmentos de texto de artículos científicos que se han incrustado de manera similar. Luego, el bot utiliza fragmentos de texto encontrados que están relacionados semánticamente con la pregunta para obtener una comprensión más completa del contexto.
La consulta del usuario y los fragmentos de texto se combinan en un «mensaje» que se envía a un modelo de lenguaje grande, un programa a gran escala que crea texto que imita el lenguaje humano natural y que genera la respuesta final. La incrustación garantiza que el texto extraído sea relevante en el contexto de la pregunta del usuario. Al proporcionar párrafos de texto del cuerpo de documentos confiables, el chatbot genera respuestas objetivas y relacionadas con las fuentes.
«El programa debe ser como un bibliotecario de referencia», dijo Yager. “Tiene que depender en gran medida de los documentos para proporcionar respuestas informadas. Debe poder interpretar con precisión las preguntas de las personas y reconstruir eficazmente el contexto de esas preguntas para recuperar la información más relevante. Si bien es posible que las respuestas aún no sean perfectas, ya es capaz de responder preguntas desafiantes y estimular algunos pensamientos interesantes al planificar nuevos proyectos e investigaciones”.
Bots que empoderan a las personas
CFN desarrolla sistemas de IA/ML como herramientas que permiten a los investigadores humanos trabajar en problemas más desafiantes e interesantes y aprovechar más su tiempo limitado, mientras las computadoras automatizan tareas repetitivas en segundo plano. Todavía hay muchas incógnitas sobre esta nueva forma de trabajar, pero estas preguntas son el comienzo de importantes debates que los científicos están manteniendo actualmente para garantizar que el uso de IA/ML sea seguro y ético.
“Hay una serie de tareas que un chatbot de dominio específico como este podría realizar para un científico. Clasificar y organizar documentos, resumir publicaciones, resaltar información relevante y profundizar en un nuevo área temática son sólo algunas de las posibles aplicaciones”, señaló Yager. “Pero estoy emocionado de ver adónde va todo esto. Nunca podríamos haber imaginado dónde estamos ahora hace tres años y espero con ansias dónde estaremos dentro de tres años”.
Para los investigadores que quieran probar este software por sí mismos, pueden encontrar el código fuente del chatbot de CFN y las herramientas asociadas en este repositorio de Github.
[ad_2]