Robustness of Agentic AI Systems via Adversarially-Aligned Jacobian Regularization

Este trabajo presenta la Regularización de Jacobiano Alineada Adversarialmente (AAJR), un método que mejora la robustez de los sistemas de IA agéntica al controlar la sensibilidad únicamente en direcciones de ascenso adversario, logrando así una mayor estabilidad en el entrenamiento minimax sin imponer restricciones globales conservadoras que degraden el rendimiento nominal.

Furkan Mumcu, Yasin Yilmaz2026-03-05🤖 cs.AI