Evaluate-as-Action: Self-Evaluated Process Rewards for Retrieval-Augmented Agents
O artigo apresenta o \textsc{EvalAct}, um método que transforma a avaliação de qualidade da recuperação em uma ação explícita e utiliza o algoritmo PCAR para otimizar agentes de raciocínio multi-etapa, resultando em ganhos significativos de precisão em tarefas de perguntas e respostas de domínio aberto.