Evaluate-as-Action: Self-Evaluated Process Rewards for Retrieval-Augmented Agents
Le papier propose \textsc{EvalAct}, une méthode qui transforme l'évaluation implicite de la qualité des recherches en une action explicite couplée à un protocole de recherche-évaluation, permettant d'optimiser les agents de récupération-augmentée grâce à une nouvelle technique d'apprentissage par renforcement appelée PCAR pour améliorer la fiabilité du raisonnement multi-étapes.