[ad_1]
[A version of this piece first appeared in TechCrunch’s robotics newsletter, Actuator. Subscribe here.]
El tema de la IA generativa aparece con frecuencia en mi boletín Actuator. Admito que hace unos meses dudaba un poco en dedicar más tiempo al tema. Cualquiera que haya estado cubriendo tecnología durante tanto tiempo como yo ha vivido innumerables ciclos de publicidad y ha resultado quemado. Cubrir la tecnología requiere una buena dosis de escepticismo, con suerte atenuado por algo de entusiasmo sobre lo que se puede hacer.
Esta vez parecía que la IA generativa estaba esperando entre bastidores, esperando el momento oportuno y esperando el inevitable cráter de la criptomoneda. A medida que la categoría se quedaba sin sangre, proyectos como ChatGPT y DALL-E estaban listos para ser el foco de informes apasionantes, esperanza, críticas, doomerismo y todos los diversos niveles kübler-rossianos de la burbuja tecnológica.
Aquellos que siguen mis cosas saben que nunca he sido particularmente optimista con las criptomonedas. Sin embargo, la situación es diferente con la IA generativa. En primer lugar, existe un acuerdo casi universal en que la inteligencia artificial y el aprendizaje automático desempeñarán en términos generales un papel más central en nuestras vidas en el futuro.
Los teléfonos inteligentes ofrecen aquí grandes conocimientos. Escribo sobre fotografía por ordenador con bastante regularidad. Ha habido un gran progreso en esta área en los últimos años y creo que muchos fabricantes finalmente han encontrado un buen equilibrio entre hardware y software cuando se trata de mejorar el producto final y reducir la barrera de entrada. Google, por ejemplo, realiza algunos trucos realmente impresionantes con funciones de edición como Best Take y Magic Eraser.
Claro, son buenos trucos, pero también son útiles y no funciones por funciones. Sin embargo, en el futuro, el verdadero truco será integrarlos perfectamente en la experiencia. En los flujos de trabajo futuros ideales, la mayoría de los usuarios tendrán poca o ninguna idea de lo que sucede detrás de escena. Estarás feliz de que funcione. Es el clásico libro de jugadas de Apple.
La IA generativa ofrece un efecto «sorpresa» similar desde el principio, lo cual es otro punto de diferencia con respecto a su predecesora del ciclo publicitario. Si su pariente menos experto en tecnología puede sentarse frente a una computadora, escribir algunas palabras en un cuadro de diálogo y luego observar cómo la caja negra escupe imágenes e historias cortas, no se requiere mucha conceptualización. Ésa es una de las principales razones por las que esto se ha popularizado tan rápidamente: cuando a la gente común se le presentan tecnologías de vanguardia, generalmente tienen que imaginar cómo serán dentro de cinco o diez años.
Con ChatGPT, DALL-E, etc. ahora puedes experimentarlo de primera mano. La desventaja de esto, por supuesto, es lo difícil que será moderar las expectativas. Por mucho que la gente tienda a dotar a los robots de inteligencia humana o animal sin un conocimiento básico de la IA, es fácil proyectar intencionalidad en este caso. Pero así es como funciona ahora. Comenzamos con el titular que llama la atención y esperamos que la gente se quede el tiempo suficiente para leer sobre las maquinaciones detrás de él.
Alerta de spoiler: nueve de cada diez veces no lo hacen, y de repente pasamos meses y años intentando que las cosas vuelvan a la realidad.
Una de las grandes ventajas de mi trabajo es la capacidad de aclarar estas cosas con personas que son mucho más inteligentes que yo. Te tomas el tiempo para explicar las cosas y espero poder traducirlo bien para los lectores (algunos intentos tienen más éxito que otros).
Cuando quedó claro que la IA generativa jugaría un papel importante en el futuro de la robótica, encontré formas de incorporar preguntas en las conversaciones. Creo que la mayoría de las personas en este campo están de acuerdo con la afirmación de la oración anterior y es fascinante ver qué impacto creen que tendrá.
Por ejemplo, en mi conversación reciente con Marc Raibert y Gill Pratt, este último explicó el papel que desempeña la IA generativa en su enfoque del aprendizaje de robots:
Una cosa que hemos descubierto cómo hacer es utilizar técnicas modernas de IA generativa que permiten a los humanos demostrar tanto la posición como la fuerza para esencialmente enseñarle a un robot usando solo unos pocos ejemplos. El código no se modifica en absoluto. La base para ello es la llamada política de difusión. Es un trabajo que hicimos en colaboración con Columbia y el MIT. Hasta ahora hemos enseñado 60 habilidades diferentes.
Cuando la semana pasada le pregunté al vicepresidente y director general de informática integrada y de vanguardia de Nvidia, Deepu Talla, por qué la empresa cree que la IA generativa es más que una moda pasajera, me dijo:
Creo que eso se refleja en los resultados. Ya se puede ver el aumento de la productividad. Puede redactar un correo electrónico para mí. No es del todo cierto, pero no tengo que empezar de cero. Me da el 70%. Hay cosas obvias que ya puedes ver y que definitivamente son un paso mejor que antes. En resumen, algo no es perfecto. No dejaré que lo leas y lo resumas. Así que ya se pueden ver algunos signos de mejoras en la productividad.
Durante mi reciente conversación con Daniela Rus, la directora del MIT CSAIL explicó cómo los investigadores están utilizando la IA generativa para diseñar los robots:
Resulta que la IA generativa puede incluso ser muy poderosa para resolver problemas de planificación de movimientos. Puede obtener soluciones mucho más rápidas y soluciones de control mucho más fluidas y humanas que con las soluciones predictivas de modelos. Creo que esto tiene un gran impacto porque los robots del futuro estarán mucho menos robotizados. Tus movimientos serán mucho más fluidos y humanos.
También utilizamos IA generativa para el diseño. Esto es muy poderoso. También es muy interesante porque no se trata sólo de generación de patrones para robots. Tienes que hacer algo más. No sólo se puede generar un patrón basado en datos. Las máquinas deben tener sentido en el contexto de la física y el mundo físico. Es por eso que los conectamos a un motor de simulación basado en la física para garantizar que los diseños cumplan con las restricciones requeridas.
Esta semana, un equipo de la Universidad Northwestern presentó su propia investigación sobre el diseño de robots generados por IA. Los investigadores presentaron cómo diseñaron un robot que «funciona con éxito en segundos». Si bien no hay mucho que ver, es fácil ver cómo este enfoque podría usarse con investigación adicional para crear sistemas más complejos.
«Hemos descubierto un algoritmo de diseño muy rápido impulsado por IA que evita los cuellos de botella de la evolución sin recurrir a los sesgos de los diseñadores humanos», dijo el líder de la investigación Sam Kriegman. “Le dijimos a la IA que queríamos un robot que pudiera caminar sobre la tierra. Luego simplemente presionamos un botón y ¡nos pusimos manos a la obra! Rápidamente creó un plano para un robot que no se parece en nada a ningún animal que haya vivido en la Tierra. A este proceso lo llamo ‘evolución instantánea'».
Fue decisión del programa de IA darle patas al pequeño y suave robot. «Esto es interesante porque no le dijimos a la IA que un robot debería tener piernas», añadió Kriegman. “Se ha redescubierto que las piernas son una buena forma de desplazarse en tierra. La locomoción con las piernas es en realidad la forma de locomoción más eficiente en la Tierra”.
«En mi opinión, la IA generativa y la automatización física/robótica cambiarán todo lo que sabemos sobre la vida en la Tierra», me dijo esta semana el fundador y director ejecutivo de Formant, Jeff Linnell. “Creo que todos somos conscientes del hecho de que la IA existe y esperamos que cada uno de nuestros trabajos, cada empresa y cada estudiante se vean afectados por ella. Creo que es una simbiosis con la robótica. No es necesario programar un robot. Hablarás con el robot en inglés, solicitarás una acción y luego se resolverá. Esto llevará un minuto”.
Antes de Formant, Linnell fundó Bot & Dolly y se desempeñó como director ejecutivo. La empresa con sede en San Francisco, más conocida por su trabajo en Gravity, fue adquirida por Google en 2013, cuando el gigante del software se propuso hacer avanzar la industria (los planes mejor trazados, etc.). El CEO me dice que su principal conclusión de esta experiencia es que todo se trata del software (dada la inclusión de Intrinsic y Everyday Robots en DeepMind, me inclino a decir que Google está de acuerdo).
[ad_2]