SE-Search: Self-Evolving Search Agent via Memory and Dense Reward
Cet article présente SE-Search, un agent de recherche autonome qui améliore les performances des modèles de langage en combinant une purification de la mémoire, un entraînement par requêtes atomiques et des récompenses denses pour optimiser le processus de recherche et réduire les erreurs factuelles.