cs.IR artículos | Gist.Science

AriadneMem: Threading the Maze of Lifelong Memory for LLM Agents

AriadneMem es un sistema de memoria estructurado para agentes LLM que, mediante un pipeline de dos fases con filtrado por entropía, coarsening consciente de conflictos y descubrimiento algorítmico de puentes, mejora significativamente la precisión en respuestas multi-hop y reduce el tiempo de ejecución en un 77,8% al gestionar eficientemente la evidencia desconectada y las actualizaciones de estado en diálogos a largo plazo.

Wenhui Zhu, Xiwen Chen, Zhipeng Wang + 11 more2026-03-05🤖 cs.AI

From Conflict to Consensus: Boosting Medical Reasoning via Multi-Round Agentic RAG

El paper presenta MA-RAG, un marco de RAG multi-vuelta basado en agentes que mejora el razonamiento médico al transformar los conflictos semánticos en consultas iterativas para refinar la evidencia externa y el historial de razonamiento, logrando un consenso de alta fidelidad que supera significativamente a los métodos existentes en siete benchmarks médicos.

Wenhao Wu, Zhentao Tang, Yafu Li + 5 more2026-03-05🤖 cs.AI

PlugMem: A Task-Agnostic Plugin Memory Module for LLM Agents

El artículo presenta PlugMem, un módulo de memoria plugin independiente de la tarea que mejora el rendimiento de los agentes LLM al transformar memorias episódicas en un grafo de conocimiento compacto y centrado en proposiciones, logrando una recuperación eficiente y superando tanto a diseños específicos de tarea como a métodos agnósticos existentes.

Ke Yang, Zixi Chen, Xuan He + 6 more2026-03-05🤖 cs.AI

Developing an AI Assistant for Knowledge Management and Workforce Training in State DOTs

Este artículo propone un marco de arquitectura multiagente basado en Generación Aumentada por Recuperación (RAG) que integra modelos de lenguaje y visión para optimizar la gestión del conocimiento y la formación de la fuerza laboral en las oficinas de transporte estatales, permitiendo la recuperación contextualizada de manuales técnicos y figuras gráficas para mejorar la toma de decisiones y la transferencia de expertise.

Divija Amaram, Lu Gao, Gowtham Reddy Gudla + 1 more2026-03-05🤖 cs.AI

Combating data scarcity in recommendation services: Integrating cognitive types of VARK and neural network technologies (LLM)

Este trabajo propone un marco híbrido innovador que combina modelos de lenguaje grandes (LLM) para el análisis semántico con perfiles cognitivos VARK para superar el problema de inicio en frío en los sistemas de recomendación, permitiendo generar sugerencias personalizadas y explicables incluso con datos iniciales limitados.

Nikita Zmanovskii2026-03-05💬 cs.CL

MemSifter: Offloading LLM Memory Retrieval via Outcome-Driven Proxy Reasoning

MemSifter es un marco innovador que optimiza la recuperación de memoria en modelos de lenguaje grandes (LLM) mediante el uso de un modelo proxy pequeño entrenado con aprendizaje por refuerzo para razonar sobre la tarea y seleccionar información relevante, logrando así un equilibrio eficiente entre precisión, coste computacional y rendimiento en tareas de larga duración.

Jiejun Tan, Zhicheng Dou, Liancheng Zhang + 3 more2026-03-05🤖 cs.AI

Graph Hopfield Networks: Energy-Based Node Classification with Associative Memory

Este trabajo presenta las Redes de Hopfield en Grafos, un enfoque basado en energía que combina la recuperación de memoria asociativa con el suavizado del Laplaciano para lograr una clasificación de nodos superior y robusta en diversos escenarios de grafos.

Abinav Rao, Alex Wa, Rishi Athavale2026-03-05🤖 cs.AI

SafeCRS: Personalized Safety Alignment for LLM-Based Conversational Recommender Systems

El artículo presenta SafeCRS, un marco de entrenamiento que integra técnicas de ajuste fino y optimización de políticas para alinear la seguridad personalizada en sistemas de recomendación conversacionales basados en LLM, logrando una reducción significativa en las violaciones de seguridad sin comprometer la calidad de las recomendaciones.

Haochang Hao, Yifan Xu, Xinzhuo Li + 2 more2026-03-05🤖 cs.AI

AgentSelect: Benchmark for Narrative Query-to-Agent Recommendation

El artículo presenta AgentSelect, un benchmark unificado que aborda la falta de métodos principistas para seleccionar configuraciones de agentes LLM al reformular la tarea como una recomendación basada en consultas narrativas, proporcionando un vasto conjunto de datos que demuestra la superioridad del emparejamiento consciente del contenido sobre los métodos tradicionales y valida su eficacia en entornos del mundo real.

Yunxiao Shi, Wujiang Xu, Tingwei Chen + 7 more2026-03-05🤖 cs.AI

Not All Candidates are Created Equal: A Heterogeneity-Aware Approach to Pre-ranking in Recommender Systems

Este artículo presenta HAP, un marco de pre-clasificación que aborda la heterogeneidad de los candidatos mediante la separación de muestras fáciles y difíciles para optimizar el entrenamiento y asignar recursos computacionales de forma adaptativa, logrando mejoras en el rendimiento y la eficiencia en el sistema de producción de Toutiao.

Pengfei Tong, Siyuan Chen, Chenwei Zhang + 4 more2026-03-05🤖 cs.AI

DisenReason: Behavior Disentanglement and Latent Reasoning for Shared-Account Sequential Recommendation

El artículo presenta DisenReason, un método de recomendación secuencial para cuentas compartidas que supera las limitaciones de los enfoques existentes al utilizar un proceso de dos etapas que combina la descomposición de comportamientos en el dominio de la frecuencia para crear una representación colectiva y el razonamiento latente para inferir dinámicamente el número de usuarios reales detrás de la cuenta, logrando así mejoras significativas en la precisión de las recomendaciones.

Jiawei Cheng, Min Gao, Zongwei Wang + 5 more2026-03-05🤖 cs.AI

LabelBuddy: An Open Source Music and Audio Language Annotation Tagging Tool Using AI Assistance

Este artículo presenta LabelBuddy, una herramienta de código abierto para la anotación colaborativa de audio que utiliza modelos de inteligencia artificial para superar la escasez de infraestructuras que capturen los matices subjetivos en la recuperación de información musical.

Ioannis Prokopiou, Ioannis Sina, Agisilaos Kounelis + 2 more2026-03-05🤖 cs.AI

$τ$ -Knowledge: Evaluating Conversational Agents over Unstructured Knowledge

El artículo presenta $\tau$ -Knowledge, un nuevo marco de evaluación que extiende $\tau$ -Bench para medir el rendimiento de agentes conversacionales en entornos de conocimiento no estructurado mediante el dominio $\tau$ -Banking, donde se demuestra que incluso los modelos más avanzados tienen dificultades para integrar eficazmente la recuperación de documentos con la ejecución de herramientas en flujos de trabajo complejos.

Quan Shi, Alexandra Zytek, Pedram Razavi + 2 more2026-03-05🤖 cs.AI

Turning Trust to Transactions: Tracking Affiliate Marketing and FTC Compliance in YouTube's Influencer Economy

Este estudio analiza un conjunto de datos de 10 años en YouTube para revelar que, aunque el marketing de afiliados es omnipresente, el cumplimiento de las normas de divulgación de la FTC es bajo, demostrando que las funciones estandarizadas de la plataforma son clave para mejorar la transparencia y la confianza en la economía de los influencers.

Chen Sun, Yash Vekaria, Zubair Shafiq + 1 more2026-03-05🤖 cs.LG

← Anterior

cs.IR