Elicit desarrolla una herramienta para automatizar la investigación de literatura científica

[ad_1]

Para los investigadores, leer artículos académicos puede llevar mucho tiempo. Según una encuesta, los científicos dedican siete horas a la semana a buscar información. Otra encuesta sugiere que las revisiones sistemáticas de la literatura (síntesis científicas de la evidencia sobre un tema en particular) toman un promedio de 41 semanas para un equipo de investigación de cinco personas.

Pero no tiene por qué ser así.

Al menos ese es el mensaje de Andreas Stuhlmüller, cofundador de la startup de inteligencia artificial Elicit, que ha desarrollado un “asistente de investigación” para científicos y laboratorios de investigación y desarrollo. Con patrocinadores como Fifty Years, Basis Set, Illusion y los inversores ángeles Jeff Dean (científico jefe de Google) y Thomas Ebeling (ex director ejecutivo de Novartis), Elicit está desarrollando una herramienta impulsada por inteligencia artificial para abstraer los aspectos más tediosos de la investigación literaria.

«Obtener es un asistente de investigación que automatiza la investigación científica utilizando modelos de lenguaje”, dijo Stuhlmüller a TechCrunch en una entrevista por correo electrónico. «Específicamente, automatiza las búsquedas bibliográficas al encontrar artículos relevantes, extraer información clave sobre los estudios y organizar la información en conceptos».

Elicit es una empresa con fines de lucro que surgió de Ought, una fundación de investigación sin fines de lucro lanzada en 2017 por Stuhlmüller, ex investigador del Laboratorio de Cognición y Computación de Stanford. El otro cofundador de Elicit, Jungwon Byun, se unió a la startup en 2019 después de liderar el crecimiento de la empresa de préstamos en línea Upstart.

Utilizando una variedad de modelos propios y de terceros, Elicit busca y descubre conceptos en varias publicaciones y permite a los usuarios hacer preguntas como «¿Cuáles son los efectos de la creatina?» o «¿Qué conjuntos de datos se han utilizado para estudiar el pensamiento lógico?». ?” y obtenga una lista de respuestas de la literatura científica.

«Al automatizar el proceso de revisión sistemática, podemos ofrecer ahorros inmediatos de costos y tiempo a las instituciones de investigación académicas e industriales que producen estas revisiones», dijo Stuhlmüller. «Al reducir los costos lo suficiente, abrimos nuevos casos de uso que antes eran inasequibles, como actualizaciones justo a tiempo a medida que cambia el estado del conocimiento en un área».

Pero espera, se podría decir: ¿no tienden los modelos lingüísticos a inventar cosas? De hecho, lo hacen. El intento de Meta de crear un modelo de lenguaje para agilizar la investigación científica, Galactica, fue cancelado apenas tres días después del lanzamiento cuando se descubrió que el modelo se refería con frecuencia a artículos de investigación falsos que parecían correctos pero que en realidad no eran reales.

Sin embargo, Stuhlmüller afirma que Elicit ha tomado medidas para garantizar que su IA sea más confiable que muchas de las plataformas especialmente diseñadas en el mercado.

Por un lado, Elicit divide las tareas complejas que realizan sus modelos en partes «comprensibles para los humanos». Esto le permite a Elicit saber, por ejemplo, con qué frecuencia diferentes modelos inventan cosas cuando hacen resúmenes, y luego ayuda a los usuarios a identificar qué respuestas verificar y cuándo.

Elicit también intenta calcular la «confiabilidad» general de un artículo científico teniendo en cuenta factores como si los estudios realizados en la investigación fueron controlados o aleatorios, la fuente de financiación y los posibles conflictos, y el tamaño de los estudios.

La herramienta de búsqueda de Elicit para literatura sobre IA.

«No hacemos interfaces de chat», afirma Stuhlmüller. «Los usuarios de Elicit aplican modelos de lenguaje como trabajos por lotes… No solo generamos respuestas utilizando modelos, sino que siempre vinculamos las respuestas a la literatura científica para reducir las alucinaciones y simplificar la verificación del trabajo con modelos».

No estoy necesariamente convencido de que Elicit haya resuelto algunos de los problemas clave que enfrentan los modelos de lenguaje hoy en día debido a su intratabilidad. Pero sus esfuerzos ciertamente parecen haber despertado el interés –y tal vez incluso la confianza– de la comunidad investigadora.

Stuhlmüller afirma que más de 200.000 personas utilizan Elicit cada mes de organizaciones como el Banco Mundial, Genentech y Stanford, lo que representa un crecimiento tres veces mayor que el año anterior. «Nuestros usuarios exigen pagar por funciones más potentes y ejecutar Elicit a mayor escala», añadió.

Presumiblemente, fue esta dinámica la que condujo a la primera ronda de financiación de Elicit: un tramo de 9 millones de dólares liderado por Fifty Years. El plan es destinar la mayor parte del dinero nuevo a seguir desarrollando el producto Elicit y ampliar el equipo de gerentes de producto y desarrolladores de software de Elicit.

Pero, ¿qué planea hacer Elicit para ganar dinero? Buena pregunta, y se la hice directamente a Stuhlmüller. Señaló la prueba paga de Elicit, que se lanzó esta semana y permite a los usuarios buscar artículos, extraer datos y resumir conceptos a una escala mayor que la que admite la versión gratuita. La estrategia a largo plazo es convertir a Elicit en una herramienta general de investigación y argumentación, en la que empresas enteras gastarían dinero.

Un posible obstáculo para el éxito comercial de Elicit son los esfuerzos de código abierto, como el modelo de lenguaje abierto del Instituto Allen de IA, que tiene como objetivo desarrollar un modelo de lenguaje a gran escala, de uso gratuito y optimizado para la ciencia. Pero Stuhlmüller dice que ve el código abierto como un complemento más que como una amenaza.

«El principal competidor en este momento es la mano de obra humana: asistentes de investigación que son contratados para extraer laboriosamente datos de los artículos», dijo Stuhlmüller. “La investigación científica es un mercado enorme y las herramientas de flujo de trabajo de investigación no tienen proveedores importantes establecidos. Aquí surgirán flujos de trabajo completamente nuevos centrados en la IA”.

[ad_2]

Subscribe to Updates

What's Hot

Elicit desarrolla una herramienta para automatizar la investigación de literatura científica

Related Posts