Test-Driven AI Agent Definition (TDAD): Compiling Tool-Using Agents from Behavioral Specifications
El artículo presenta TDAD, una metodología que trata los prompts de agentes de IA como artefactos compilados mediante especificaciones conductuales y pruebas ocultas para garantizar el cumplimiento de comportamientos, prevenir regresiones silenciosas y mitigar el juego de especificaciones en agentes que utilizan herramientas.