cs.IR artículos | Gist.Science

One Model Is Enough: Native Retrieval Embeddings from LLM Agent Hidden States

Este trabajo propone equipar a los agentes de LLM con capacidades de recuperación nativas mediante un cabezal de proyección ligero que mapea sus estados ocultos directamente al espacio de incrustaciones, eliminando la necesidad de un modelo de incrustación separado y manteniendo el 97% de la calidad de recuperación original.

Bo JiangTue, 10 Ma💬 cs.CL

OfficeQA Pro: An Enterprise Benchmark for End-to-End Grounded Reasoning

El artículo presenta OfficeQA Pro, un nuevo benchmark que evalúa la capacidad de razonamiento fundamentado de agentes de IA sobre un corpus masivo y heterogéneo de documentos del Tesoro de EE. UU., revelando que incluso los modelos de vanguardia actuales tienen un rendimiento muy limitado en esta tarea y que la representación estructurada de documentos puede mejorar significativamente sus resultados.

Krista Opsahl-Ong, Arnav Singhvi, Jasmine Collins, Ivan Zhou, Cindy Wang, Ashutosh Baheti, Owen Oertell, Jacob Portes, Sam Havens, Erich Elsen, Michael Bendersky, Matei Zaharia, Xing ChenTue, 10 Ma💬 cs.CL

Explainability of Text Processing and Retrieval Methods: A Survey

Este artículo ofrece una amplia revisión de las investigaciones sobre la explicabilidad e interpretabilidad de los métodos de procesamiento del lenguaje natural y recuperación de información, abarcando desde representaciones de palabras y modelos de atención hasta transformadores y sistemas de clasificación de documentos, y concluye sugiriendo direcciones futuras para la investigación en este campo.

Sourav Saha, Debapriyo Majumdar, Mandar MitraThu, 12 Ma💬 cs.CL

Taming the Long Tail: Denoising Collaborative Information for Robust Semantic ID Generation

El artículo presenta ADC-SID, un marco que mejora la generación de identificadores semánticos robustos en sistemas de recomendación mediante la descomposición adaptativa del ruido colaborativo y la ponderación dinámica de los identificadores conductuales para mitigar los sesgos de la cola larga.

Yi Xu, Moyu Zhang, Chaofan Fan, Jinxin Hu, Xiaochen Li, Yu Zhang, Xiaoyi Zeng, Jing ZhangThu, 12 Ma💻 cs

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

Esta investigación demuestra que el orden de evaluación en las reseñas en línea (calificación antes o después del texto) polariza las calificaciones de los consumidores mediante un mecanismo de heurística afectiva y esfuerzo cognitivo, donde la secuencia "calificación primero" amplifica las puntuaciones extremas según la calidad del servicio y el tipo de producto, un hallazgo respaldado por datos secundarios de plataformas como Yelp y Letterboxd.

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Does Reasoning Make Search More Fair? Comparing Fairness in Reasoning and Non-Reasoning Rerankers

Este estudio compara sistemáticamente la equidad de los rerankers con y sin capacidades de razonamiento, concluyendo que el razonamiento por sí solo no mejora ni perjudica la equidad, ya que los modelos actuales preservan las características de equidad de sus entradas y presentan brechas demográficas independientes de la arquitectura.

Saron Samuel, Benjamin Van Durme, Eugene YangThu, 12 Ma🤖 cs.AI

Beyond Interleaving: Causal Attention Reformulations for Generative Recommender Systems

Este trabajo propone una reformulación causal de los sistemas de recomendación generativa mediante las arquitecturas AttnLFA y AttnMVP, las cuales eliminan la intercalación ineficiente de tokens para reducir la complejidad secuencial en un 50%, mejorar el rendimiento y disminuir el tiempo de entrenamiento en comparación con los métodos basales.

Hailing ChengThu, 12 Ma🤖 cs.AI

Differentiable Geometric Indexing for End-to-End Generative Retrieval

El artículo presenta la Indexación Geométrica Diferenciable (DGI), un enfoque que resuelve los conflictos de optimización y geométricos en la Recuperación Generativa mediante la unificación operativa con Gumbel-Softmax y la optimización isótropa en la esfera unitaria, logrando así un rendimiento superior, especialmente en escenarios de cola larga.

Xujing Wang, Yufeng Chen, Boxuan Zhang, Jie Zhao, Chao Wei, Cai Xu, Ziyu Guan, Wei Zhao, Weiru Zhang, Xiaoyi ZengThu, 12 Ma💻 cs

Modeling Stage-wise Evolution of User Interests for News Recommendation

Este trabajo propone un marco unificado para la recomendación de noticias que modela la evolución de los intereses de los usuarios en etapas, combinando la captura de preferencias a largo plazo mediante un grafo global con el análisis de dinámicas a corto plazo a través de subgrafos temporales escalonados, superando así a los enfoques existentes en la gestión de la sensibilidad temporal de las noticias.

Zhiyong Cheng, Yike Jin, Zhijie Zhang, Huilin Chen, Zhangling Duan, Meng WangThu, 12 Ma🤖 cs.AI

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

Este artículo presenta un marco innovador para sistemas de agentes auto-mejorables que extrae aprendizajes estructurados de las trayectorias de ejecución mediante análisis semántico y atribución de decisiones, permitiendo la recuperación contextual de estrategias, recuperaciones y optimizaciones que logran mejoras significativas en la finalización de tareas complejas.

Gaodan Fang, Vatche Isahagian, K. R. Jayaram, Ritesh Kumar, Vinod Muthusamy, Punleuk Oum, Gegi ThomasThu, 12 Ma🤖 cs.AI

A Hypergraph-Based Framework for Exploratory Business Intelligence

Este artículo presenta ExBI, un sistema innovador basado en hipergrafos que supera las limitaciones de los sistemas de Inteligencia de Negocios tradicionales mediante esquemas dinámicos y reutilización de vistas, logrando aceleraciones significativas (hasta 230 veces) y una alta precisión en flujos de trabajo exploratorios a gran escala.

Yunkai Lou, Shunyang Li, Longbin Lai, Jianke Yu, Wenyuan Yu, Ying ZhangThu, 12 Ma💻 cs

Breaking User-Centric Agency: A Tri-Party Framework for Agent-Based Recommendation

Este trabajo presenta TriRec, el primer marco de recomendación basado en agentes LLM de tres partes que coordina la utilidad del usuario, la exposición de los artículos y la equidad de la plataforma mediante una arquitectura de dos etapas, logrando mejoras simultáneas en precisión, equidad y utilidad sin sacrificar la relevancia.

Yaxin Gong, Chongming Gao, Chenxiao Fan, Wenjie Wang, Fuli Feng, Xiangnan HeThu, 12 Ma💻 cs

Structured Linked Data as a Memory Layer for Agent-Orchestrated Retrieval

Este artículo demuestra que el uso de datos vinculados estructurados, específicamente mediante páginas de entidades optimizadas para agentes que integran instrucciones, migas de pan y capacidades de búsqueda neuronal, mejora significativamente la precisión y la calidad de las respuestas en sistemas de Recuperación Aumentada por Generación (RAG) tanto estándar como agénticos.

Andrea Volpini, Elie Raad, Beatrice Gamba, David RiccitelliThu, 12 Ma🤖 cs.AI

RAGPerf: An End-to-End Benchmarking Framework for Retrieval-Augmented Generation Systems

El documento presenta RAGPerf, un marco de referencia de código abierto y bajo costo que permite el análisis detallado y la configuración modular de sistemas de generación aumentada por recuperación (RAG) mediante la evaluación de su rendimiento, uso de recursos y precisión en diversos escenarios y componentes.

Shaobo Li, Yirui Zhou, Yuan Xu, Kevin Chen, Daniel Waddington, Swaminathan Sundararaman, Hubertus Franke, Jian HuangThu, 12 Ma💻 cs

Interpretable Chinese Metaphor Identification via LLM-Assisted MIPVU Rule Script Generation: A Comparative Protocol Study

Este estudio presenta un pipeline asistido por LLM que transforma cuatro protocolos de identificación de metáforas en scripts de reglas ejecutables y auditables para el chino, demostrando que la elección del protocolo es la fuente principal de variación en la identificación y que este enfoque logra un rendimiento competitivo con total transparencia e interpretabilidad.

Weihang Huang, Mengna LiuThu, 12 Ma💬 cs.CL

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

Este trabajo presenta un corpus bilingüe (inglés/alemán) de registros de catálogo anotados con la Integrated Authority File (GND) y una taxonomía procesable por máquinas, diseñado para habilitar la clasificación multietiqueta consciente de la ontología y evaluar sistemas de IA que asistan a los catalogadores en la indexación a escala.

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma SuominenThu, 12 Ma💬 cs.CL

A Hybrid Knowledge-Grounded Framework for Safety and Traceability in Prescription Verification

El artículo presenta PharmGraph-Auditor, un sistema innovador que combina una Base de Conocimiento Farmacéutico Híbrida (HPKB) con un paradigma de Verificación Basada en Conocimiento (CoV) para transformar a los modelos de lenguaje en motores de razonamiento transparentes y seguros, mejorando así la precisión y la trazabilidad en la verificación de recetas médicas.

Yichi Zhu, Kan Ling, Xu Liu, Hengrun Zhang, Huiqun Yu, Guisheng FanThu, 12 Ma🤖 cs.AI

A Systematic Study of Pseudo-Relevance Feedback with LLMs

Este estudio sistémico demuestra que la elección del modelo de retroalimentación es crucial para la efectividad del PRF con LLMs, revelando que el texto generado por el LLM es la solución más rentable, mientras que el texto del corpus es más beneficioso cuando se utiliza un recuperador inicial robusto.

Nour Jedidi, Jimmy LinThu, 12 Ma💬 cs.CL

LLMGreenRec: LLM-Based Multi-Agent Recommender System for Sustainable E-Commerce

El artículo presenta LLMGreenRec, un nuevo sistema de recomendación multiagente basado en modelos de lenguaje grande que fomenta el consumo sostenible en el comercio electrónico al identificar intenciones ecológicas de los usuarios y reducir simultáneamente la huella de carbono digital.

Hao N. Nguyen, Hieu M. Nguyen, Son Van Nguyen, Nguyen Thi HanhThu, 12 Ma💻 cs

Chasing RATs: Tracing Reading for and as Creative Activity

El artículo presenta las "Reading Activity Traces" (RATs), un marco que revaloriza la lectura como una actividad creativa en sí misma al hacer visibles los procesos de navegación, interpretación y curación que las herramientas automatizadas suelen ocultar, ilustrado mediante una implementación especulativa en Wikipedia llamada WikiRAT.

Sophia Liu, Shm Garanganao AlmedaThu, 12 Ma💻 cs

← Anterior Siguiente →