Mem-T: Densifying Rewards for Long-Horizon Memory Agents
Mem-T è un agente di memoria autonomo che, grazie al framework di apprendimento per rinforzo MoT-GRPO, risolve il problema della ricompensa sparsa in compiti a lungo termine densificando il feedback e ottimizzando congiuntamente la costruzione e il recupero della memoria, ottenendo prestazioni superiori e un'efficienza computazionale migliorata rispetto agli approcci esistenti.