cs.IR artículos | Gist.Science

ThinkQE: Query Expansion via an Evolving Thinking Process

El artículo presenta ThinkQE, un marco de expansión de consultas en tiempo de prueba que mejora la recuperación en búsquedas web mediante un proceso de "pensamiento" para la exploración semántica profunda y una estrategia de interacción con el corpus que refina iterativamente los resultados, superando consistentemente a métodos anteriores en diversos benchmarks.

Yibin Lei, Tao Shen, Andrew YatesWed, 11 Ma💬 cs.CL

TaoSR1: The Thinking Model for E-commerce Relevance Search

El paper presenta TaoSR1, un marco innovador que despliega directamente modelos de lenguaje grandes con razonamiento paso a paso para la búsqueda en comercio electrónico, superando las limitaciones de los modelos tradicionales mediante un entrenamiento en tres etapas que combina ajuste fino, optimización de preferencias y muestreo dinámico para lograr un rendimiento superior tanto en pruebas offline como en evaluaciones humanas en línea.

Chenhe Dong, Shaowei Yao, Pengkun Jiao, Jianhui Yang, Yiming Jin, Zerui Huang, Xiaojiang Zhou, Dan Ou, Haihong Tang, Bo ZhengWed, 11 Ma🤖 cs.AI

Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

El artículo presenta ELERAG, una arquitectura de generación aumentada por recuperación (RAG) que integra la vinculación de entidades y una estrategia de reordenamiento híbrida para mejorar significativamente la precisión factual en sistemas de preguntas y respuestas educativas en italiano, demostrando su superioridad sobre métodos convencionales en dominios específicos.

Francesco Granata, Francesco Poggi, Misael MongiovìWed, 11 Ma🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

El artículo presenta MCGI, un método de indexación de grafos residente en disco que utiliza la dimensión intrínseca local para adaptar dinámicamente la búsqueda de vecinos más cercanos aproximados a la geometría de los datos, logrando un rendimiento superior y una mayor escalabilidad en conjuntos de datos de miles de millones de elementos en comparación con las soluciones actuales.

Dongfang ZhaoWed, 11 Ma🤖 cs.AI

Scaling Multilingual Semantic Search in Uber Eats Delivery

Este artículo presenta un sistema de recuperación semántica multilingüe y multi-vertical para Uber Eats que, mediante el ajuste fino de un modelo Qwen2 con aprendizaje de representaciones matryoshka y una combinación de funciones de pérdida, logra mejoras significativas en la recuperación de tiendas, platos y artículos de supermercado en múltiples mercados.

Bo Ling, Zheng Liu, Haoyang Chen, Divya Nagar, Luting Yang, Mehul ParsanaWed, 11 Ma💻 cs

Time warping with Hellinger elasticity

Este artículo presenta el algoritmo de Alineamiento Temporal Elástico, que resuelve el problema de emparejamiento de series temporales en espacios métricos arbitrarios utilizando una penalización de estiramiento basada en el núcleo de Hellinger y logra una complejidad computacional cúbica.

Yuly BilligWed, 11 Ma💻 cs

Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage

Este estudio demuestra mediante múltiples benchmarks y sistemas que las métricas de recuperación basadas en cobertura son indicadores fiables del alcance informativo en las respuestas generadas por sistemas RAG, especialmente cuando los objetivos de recuperación y generación están alineados.

Saron Samuel, Alexander Martin, Eugene Yang, Andrew Yates, Dawn Lawrie, Ian Soborof, Laura Dietz, Benjamin Van DurmeWed, 11 Ma🤖 cs.AI

Quantifying Uncertainty in AI Visibility: A Statistical Framework for Generative Search Measurement

Este artículo demuestra que las métricas de visibilidad en motores de búsqueda generativos son inherentemente estocásticas y variables, por lo que las estimaciones de un solo intento son engañosas y deben reemplazarse por un marco estadístico que cuantifique la incertidumbre mediante intervalos de confianza y análisis de distribuciones.

Ronald SielinskiWed, 11 Ma🤖 cs.AI

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

El sistema Guardian presenta un marco de decisión interpretable que combina cadenas de Markov, aprendizaje por refuerzo y validación mediante modelos de lenguaje grandes para generar planes de búsqueda óptimos y dinámicos para casos de niños desaparecidos durante las primeras 72 horas.

Joshua Castillo, Ravi MukkamalaWed, 11 Ma🤖 cs.AI

PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration

El artículo presenta PathoScribe, un marco unificado impulsado por modelos de lenguaje grandes que transforma los archivos de patología estáticos en una biblioteca viva y razonable, permitiendo la recuperación semántica, la construcción automatizada de cohortes y la integración clínica con una precisión y eficiencia significativamente superiores a los métodos tradicionales.

Abdul Rehman Akbar, Samuel Wales-McGrath, Alejadro Levya, Lina Gokhale, Rajendra Singh, Wei Chen, Anil Parwani, Muhammad Khalid Khan NiaziWed, 11 Ma🤖 cs.AI

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

El artículo presenta a Guardian, un sistema de tubería multi-LLM que utiliza modelos especializados y un mecanismo de consenso, junto con ajuste fino QLoRA, para extraer y procesar información de manera auditable y coordinada durante las primeras 72 horas críticas de investigaciones de personas desaparecidas.

Joshua Castillo, Ravi MukkamalaWed, 11 Ma🤖 cs.AI

Unlocking High-Fidelity Analog Joint Source-Channel Coding on Standard Digital Transceivers

El artículo presenta D2AJSCC, un marco innovador que permite desplegar codificación conjunta de fuente y canal analógica de alta fidelidad en transceptores digitales estándar mediante la síntesis de ondas mediante subportadoras y el uso de ProxyNet para el entrenamiento de extremo a extremo, superando así las limitaciones de hardware y logrando una degradación elegante en la transmisión semántica.

Shumin Yao, Hao Chen, Yaping Sun, Nan Ma, Xiaodong Xu, Qinglin Zhao, Shuguang CuiWed, 11 Ma🔢 math

From Verification to Amplification: Auditing Reverse Image Search as Algorithmic Gatekeeping in Visual Misinformation Fact-checking

Este estudio audita la búsqueda inversa de imágenes de Google y revela que, como herramienta de verificación, a menudo prioriza la desinformación repetida y contenido irrelevante sobre las correcciones, exponiendo así las limitaciones del gatekeeping algorítmico en la lucha contra la información visual falsa.

Cong Lin, Yifei Chen, Jiangyue Chen, Yingdan Lu, Yilang Peng, Cuihua ShenWed, 11 Ma💻 cs

DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering

El artículo presenta DataFactory, un marco colaborativo de múltiples agentes que supera las limitaciones de los modelos de lenguaje actuales en la respuesta a preguntas sobre tablas mediante la orquestación de equipos especializados, la transformación automática de datos a grafos de conocimiento y estrategias de ingeniería de contexto, logrando mejoras significativas en precisión y robustez en diversos conjuntos de datos.

Tong Wang, Chi Jin, Yongkang Chen, Huan Deng, Xiaohui Kuang, Gang ZhaoWed, 11 Ma🤖 cs.AI

Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval

El artículo presenta RF-Mem, un recuperador de memoria dual que imita los procesos cognitivos humanos de familiaridad y recuerdo para personalizar de manera escalable y eficiente los modelos de lenguaje grandes, superando las limitaciones de los métodos de recuperación actuales.

Yingyi Zhang, Junyi Li, Wenlin Zhang, Penyue Jia, Xianneng Li, Yichao Wang, Derong Xu, Yi Wen, Huifeng Guo, Yong Liu, Xiangyu ZhaoWed, 11 Ma💻 cs

Diagnosing and Repairing Citation Failures in Generative Engine Optimization

Este artículo presenta AgentGEO, un sistema agéntico que diagnostica y repara específicamente los modos de fallo en la citación de documentos dentro de la Optimización para Motores Generativos (GEO), logrando una mejora superior del 40% en las tasas de citación con cambios mínimos en el contenido en comparación con métodos basados en reglas genéricas.

Zhihua Tian, Yuhan Chen, Yao Tang, Jian Liu, Ruoxi JiaWed, 11 Ma💬 cs.CL

TA-Mem: Tool-Augmented Autonomous Memory Retrieval for LLM in Long-Term Conversational QA

El paper presenta TA-Mem, un marco de recuperación de memoria autónoma aumentada con herramientas para LLMs que supera las limitaciones de los métodos estáticos mediante agentes adaptativos y una base de datos multiíndice, logrando mejoras significativas en el rendimiento en tareas de preguntas y respuestas conversacionales a largo plazo.

Mengwei Yuan, Jianan Liu, Jing Yang, Xianyou Li, Weiran Yan, Yichao Wu, Penghao LiangWed, 11 Ma💬 cs.CL

PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution

El documento presenta PRECEPT, un marco unificado para la adaptación en tiempo de prueba en agentes LLM que combina recuperación exacta de reglas, memoria consciente de conflictos y evolución de prompts guiada por Pareto para superar la degradación en la recuperación de conocimientos, mejorar la composición de reglas y garantizar la robustez ante conocimientos obsoletos o adversarios.

Arash ShahmansooriWed, 11 Ma🤖 cs.AI

Understanding the Interplay between LLMs' Utilisation of Parametric and Contextual Knowledge: A keynote at ECIR 2025

Esta ponencia de ECIR 2025 explora la interacción entre el conocimiento paramétrico y contextual en los modelos de lenguaje, presentando investigaciones sobre la evaluación de dichos conocimientos, la detección de conflictos internos y externos, y las características que permiten una integración efectiva del contexto.

Isabelle AugensteinWed, 11 Ma💬 cs.CL

Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records

Este estudio presenta un marco de clasificación automatizado para la gestión de riesgos cardíacos en pacientes geriátricos que, al utilizar registros de salud electrónicos no estructurados, demuestra que una arquitectura Transformer personalizada supera a los métodos tradicionales y a los modelos de lenguaje generativos, ofreciendo una alternativa robusta a la codificación manual.

Jacopo Vitale, David Della Morte, Luca Bacco, Mario Merone, Mark de Groot, Saskia Haitjema, Leandro Pecchia, Bram van EsWed, 11 Ma🤖 cs.AI