AriadneMem: Threading the Maze of Lifelong Memory for LLM Agents

AriadneMem es un sistema de memoria estructurado para agentes LLM que, mediante un pipeline de dos fases con filtrado por entropía, coarsening consciente de conflictos y descubrimiento algorítmico de puentes, mejora significativamente la precisión en respuestas multi-hop y reduce el tiempo de ejecución en un 77,8% al gestionar eficientemente la evidencia desconectada y las actualizaciones de estado en diálogos a largo plazo.

Wenhui Zhu, Xiwen Chen, Zhipeng Wang + 11 more2026-03-05🤖 cs.AI

From Conflict to Consensus: Boosting Medical Reasoning via Multi-Round Agentic RAG

El paper presenta MA-RAG, un marco de RAG multi-vuelta basado en agentes que mejora el razonamiento médico al transformar los conflictos semánticos en consultas iterativas para refinar la evidencia externa y el historial de razonamiento, logrando un consenso de alta fidelidad que supera significativamente a los métodos existentes en siete benchmarks médicos.

Wenhao Wu, Zhentao Tang, Yafu Li + 5 more2026-03-05🤖 cs.AI

Developing an AI Assistant for Knowledge Management and Workforce Training in State DOTs

Este artículo propone un marco de arquitectura multiagente basado en Generación Aumentada por Recuperación (RAG) que integra modelos de lenguaje y visión para optimizar la gestión del conocimiento y la formación de la fuerza laboral en las oficinas de transporte estatales, permitiendo la recuperación contextualizada de manuales técnicos y figuras gráficas para mejorar la toma de decisiones y la transferencia de expertise.

Divija Amaram, Lu Gao, Gowtham Reddy Gudla + 1 more2026-03-05🤖 cs.AI

MemSifter: Offloading LLM Memory Retrieval via Outcome-Driven Proxy Reasoning

MemSifter es un marco innovador que optimiza la recuperación de memoria en modelos de lenguaje grandes (LLM) mediante el uso de un modelo proxy pequeño entrenado con aprendizaje por refuerzo para razonar sobre la tarea y seleccionar información relevante, logrando así un equilibrio eficiente entre precisión, coste computacional y rendimiento en tareas de larga duración.

Jiejun Tan, Zhicheng Dou, Liancheng Zhang + 3 more2026-03-05🤖 cs.AI

AgentSelect: Benchmark for Narrative Query-to-Agent Recommendation

El artículo presenta AgentSelect, un benchmark unificado que aborda la falta de métodos principistas para seleccionar configuraciones de agentes LLM al reformular la tarea como una recomendación basada en consultas narrativas, proporcionando un vasto conjunto de datos que demuestra la superioridad del emparejamiento consciente del contenido sobre los métodos tradicionales y valida su eficacia en entornos del mundo real.

Yunxiao Shi, Wujiang Xu, Tingwei Chen + 7 more2026-03-05🤖 cs.AI

Not All Candidates are Created Equal: A Heterogeneity-Aware Approach to Pre-ranking in Recommender Systems

Este artículo presenta HAP, un marco de pre-clasificación que aborda la heterogeneidad de los candidatos mediante la separación de muestras fáciles y difíciles para optimizar el entrenamiento y asignar recursos computacionales de forma adaptativa, logrando mejoras en el rendimiento y la eficiencia en el sistema de producción de Toutiao.

Pengfei Tong, Siyuan Chen, Chenwei Zhang + 4 more2026-03-05🤖 cs.AI

DisenReason: Behavior Disentanglement and Latent Reasoning for Shared-Account Sequential Recommendation

El artículo presenta DisenReason, un método de recomendación secuencial para cuentas compartidas que supera las limitaciones de los enfoques existentes al utilizar un proceso de dos etapas que combina la descomposición de comportamientos en el dominio de la frecuencia para crear una representación colectiva y el razonamiento latente para inferir dinámicamente el número de usuarios reales detrás de la cuenta, logrando así mejoras significativas en la precisión de las recomendaciones.

Jiawei Cheng, Min Gao, Zongwei Wang + 5 more2026-03-05🤖 cs.AI

ττ-Knowledge: Evaluating Conversational Agents over Unstructured Knowledge

El artículo presenta τ\tau-Knowledge, un nuevo marco de evaluación que extiende τ\tau-Bench para medir el rendimiento de agentes conversacionales en entornos de conocimiento no estructurado mediante el dominio τ\tau-Banking, donde se demuestra que incluso los modelos más avanzados tienen dificultades para integrar eficazmente la recuperación de documentos con la ejecución de herramientas en flujos de trabajo complejos.

Quan Shi, Alexandra Zytek, Pedram Razavi + 2 more2026-03-05🤖 cs.AI

Turning Trust to Transactions: Tracking Affiliate Marketing and FTC Compliance in YouTube's Influencer Economy

Este estudio analiza un conjunto de datos de 10 años en YouTube para revelar que, aunque el marketing de afiliados es omnipresente, el cumplimiento de las normas de divulgación de la FTC es bajo, demostrando que las funciones estandarizadas de la plataforma son clave para mejorar la transparencia y la confianza en la economía de los influencers.

Chen Sun, Yash Vekaria, Zubair Shafiq + 1 more2026-03-05🤖 cs.LG