Kyle Wiggers / TechCrunch:
Antroposcientíficos: los modelos de IA se pueden entrenar para engañar, y las técnicas de seguridad de IA más utilizadas han tenido poco o ningún impacto en el comportamiento engañoso.— La mayoría de las personas aprenden la capacidad de engañar a otras personas. Entonces, ¿pueden los modelos de IA aprender lo mismo? Sí, la respuesta parece ser… y, sorprendentemente, son excepcionalmente buenos en eso.
[ad_2]