Descubrir las indicaciones de texto correctas para obtener los mejores resultados de los sistemas de IA como DALL-E 2 de OpenAI se ha convertido en una ciencia en sí misma. Ahora, una startup está tratando de permitir que los «ingenieros rápidos» ganen dinero con un mercado en línea que vende estas frases finamente afinadas.
PromptBase, lanzado en junio, permite a los usuarios vender cadenas de palabras que producen resultados predecibles con ciertos sistemas. Con un precio de $ 1.99, PromptBase obtiene un descuento del 20%, el contenido que genera las indicaciones varía desde titulares «virales» hasta imágenes de logotipos de equipos deportivos, muñecos tejidos y animales con trajes.
Por el momento, PromptBase solo aloja avisos probados en DALL-E 2 y GPT-3. Pero según el fundador Ben Stokes, la plataforma se expandirá a otros sistemas en el futuro.
“Nuestro objetivo final es desarrollar herramientas para ayudar a apoyar inmediato ingenieros Son los primeros días, así que por ahora solo estamos tratando de correr la voz y encontrarlo. inmediato Ingenieros para iniciar sesión y comenzar a enumerar los suyos indicaciones a la venta en nuestro mercado”, dijo Stokes a TechCrunch por correo electrónico. “Ya estamos viendo grandes empresas de tecnología construyendo sus propios sistemas similares a GPT-3 y DALL-E, y preveo muchos más por venir. Es probable que se utilicen diferentes sistemas como herramientas en un cinturón de herramientas, al igual que los diferentes lenguajes de programación que se utilizan hoy en día, y planeamos incluirlos a todos a medida que ganen popularidad”.

Los usuarios pueden comprar y vender avisos del sistema de IA en el mercado de PromptBase. Autor de la foto: PromptBase
La venta de avisos no viola los términos de servicio de un proveedor de IA, pero puede abrir una lata de gusanos éticos y legales, según el tipo de avisos que se vendan. Además, demuestra la vulnerabilidad, y la imprevisibilidad, incluso de los sistemas de IA más potentes disponibles en la actualidad.
Ingeniería rápida
La ingeniería rápida es un concepto en IA que tiene como objetivo incorporar la descripción de una tarea (como generar arte para criaturas peludas) en el texto. La idea es dar a un sistema de IA «directrices» o instrucciones detalladas para que pueda hacer de manera confiable el trabajo que se le pide con su conocimiento del mundo. En general, los resultados para un aviso como «imagen fija de una mujer tomando café, yendo al trabajo, teleobjetivo» son mucho más consistentes que «una mujer caminando».
Se pueden utilizar avisos para enseñar a un sistema de formación de imágenes a distinguir entre, por ejemplo, «una imagen que contiene patatas» y «una colección de patatas». También pueden actuar como una especie de «filtro», creando imágenes con las características de un boceto, pintura, textura, animación o incluso un ilustrador específico (por ejemplo, Maurice Sendak). Y las indicaciones pueden presentar el mismo tema en diferentes estilos, como «el dibujo de un niño de un koala andando en bicicleta» o «una fotografía antigua de un koala andando en bicicleta».
Las indicaciones pueden tener muchos matices. Debido a la forma en que los sistemas de IA interpretan los patrones en imágenes y texto, no todos tienen una estructura predecible, o incluso significativa. Por ejemplo, el mensaje «Una pintura muy bonita de una montaña junto a una cascada» con DALL-E 2 arroja peores resultados que «Una pintura muy, muy bonita de una montaña junto a una cascada». ¿La razón? El sistema otorga un valor excesivo a la palabra ‘muy’.
Vale la pena señalar que el ejemplo «muy» es específico para una iteración particular de DALL-E 2 y lo más probable es que no funcione en otra. Pero esa es una de las razones principales por las que la ingeniería rápida puede ser valiosa: descubrir casos extremos.
En un intrigante estudio de la Universidad de Texas en Austin, los investigadores documentaron un extenso vocabulario de indicaciones extrañas que se pueden usar para generar imágenes con DALL-E 2. Descubrieron que el sistema entiende «Apoploe vesrreaitais», un galimatías, que significa «pájaros» y «Contarra ccetnxniams luryca tanniounons», que significa «bichos» o «plagas» (a veces). Darle a DALL-E 2 el mensaje «Apoploe vesrreaitais eat Contarra ccetnxniams luryca tanniounons» resultó en imágenes de pájaros comiendo insectos.
Aunque estas palabras sin sentido probablemente correspondan a alguna lógica interna en el sistema, algunos científicos de datos han comparado las indicaciones con «encantamientos» o «palabras mágicas», y por qué la ingeniería de indicaciones ha catalizado todo un campo de estudio académico.
Indicaciones problemáticas
Varios investigadores y entusiastas han publicado recursos gratuitos que contienen avisos para sistemas populares de IA, principalmente DALL-E 2. PromptBase es uno de los primeros en monetizar el intercambio, y ya tiene críticos. Hay un largo debate en la comunidad de IA sobre qué investigación, si es que hay alguna, debe o puede comercializarse; Un usuario de Reddit argumenta que PromptBase está «iniciando una tendencia que amenaza la apertura y accesibilidad de la IA en general».
Pero Stokes defiende el modelo, argumentando que muchas de las indicaciones en PromptBase representan horas de trabajo de ingeniería real y conocimiento.
«Hoy tenemos indicaciones para generar texto e imágenes simples, pero no es demasiado difícil extrapolar años en el futuro donde tendremos indicaciones para generar videos, y tal vez algún día incluso largometrajes con partituras orquestales», agregó Stokes. «Aquellas personas que puedan crear las indicaciones necesarias de alta calidad que guíen a la IA en estas cosas serán extremadamente valiosas. No se sabe qué tan grande será el mercado, pero lo veo como una habilidad clave, si no el futuro de la programación”.
Por supuesto, hay poco que hable en contra de que un cliente de PromptBase publique una compra posterior inmediata. Pero ese podría ser el menor de los problemas de PromptBase.
Los estudios muestran que los sistemas de lenguaje como GPT-3, entrenados en una gran cantidad de datos públicos, pueden «filtrar» información personal, incluidos nombres y direcciones, cuando se les envían ciertas indicaciones. Algunas indicaciones podrían alentar la infracción de derechos de autor, como las que instruyen a DALL-E 2 para «crear modelos 3D de Pokémon». Otros podrían usarse para eludir los filtros de nivel de palabra para engañar a un sistema de imágenes para que emita imágenes «restringidas», teorizan los investigadores, como imágenes de violencia (por ejemplo, «un caballo acostado en un charco de líquido rojo»).
Stokes dijo que PromptBase analiza todos los listados en el mercado para asegurarse de que no violen las «reglas de generación de IA». Pero a medida que crece el negocio, mantener ese nivel de control podría volverse más difícil.
Vagrant Gautam, lingüista computacional del Saarland College en Alemania, está de acuerdo en que existe la posibilidad de abuso. Sin embargo, también señala que el mercado rápido podría brindar una oportunidad de ingresos para artistas y otras personas creativas o buenas para depurar.
«[It points] la importancia de la ingeniería rápida, así como la importancia de las habilidades requeridas para hacerlo: creatividad, tiempo, pensamiento contradictorio, etc. Muchas personas han dicho que DALL-E 2 les facilitará la creación de imágenes o arte de les gusta, descubren que hay un arte en hacerlo y que a menudo requiere mucho esfuerzo”, dijo Gautam.
Estos intentos pueden resultar costosos, ya que sistemas como DALL-E 2 no son precisamente de uso gratuito. Stokes mismo dice que pagó una «fortuna» tratando de descifrar un indicador de GPT-3 en otra de sus empresas, Paper Website.

Autor de la foto: PromptBase
«La gente ahora también se queja de la monetización, diciendo que hay muy pocas formas de modificar su aviso antes de tener que empezar a pagar», continuó Gautam. «Me parece muy interesante: este enfoque de prueba y error contradictorio que las personas deben adoptar para descubrir exactamente cómo hacer que los modelos generativos hagan lo que quieren».
Pasará un tiempo antes de que el polvo se asiente en la ingeniería rápida comercializada. Por último, pero no menos importante, PromptBase planteará, y ha planteado, preguntas sobre los sistemas de IA que transformarán innumerables industrias.