M: Dual-Memory Augmentation for Long-Horizon Web Agents via Trajectory Summarization and Insight Retrieval
O artigo apresenta o M, um framework livre de treinamento que utiliza um mecanismo de memória dupla, combinando sumarização dinâmica de trajetórias e recuperação de insights, para superar as limitações de tarefas de longo prazo em agentes web, resultando em aumentos significativos nas taxas de sucesso e reduções substanciais no uso de tokens.