Signal in the Noise: Decoding the Reality of Airline Service Quality with Large Language Models

Este estudio valida un marco basado en modelos de lenguaje grande que, al analizar más de 16.000 reseñas de TripAdvisor, revela una desconexión operativa crítica en EgyptAir y demuestra que esta metodología supera a las métricas tradicionales al transformar el feedback no estructurado en inteligencia estratégica accionable para la industria aérea.

Ahmed Dawoud, Osama El-Shamy, Ahmed Habashy2026-03-06💻 cs

iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

El artículo presenta iAgentBench, un nuevo benchmark dinámico que evalúa la capacidad de los agentes de búsqueda para realizar un sentido de la información integrando evidencia de múltiples fuentes en temas de alto tráfico, superando así las limitaciones de las pruebas actuales que solo requieren recuperar un único fragmento de texto.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

CONE: Embeddings for Complex Numerical Data Preserving Unit and Variable Semantics

El artículo presenta CONE, un modelo híbrido preentrenado que utiliza un algoritmo de construcción de incrustaciones compuesto para codificar números, rangos y gaussianas junto con sus unidades y atributos, logrando un razonamiento numérico superior y superando a los modelos más avanzados en diversas tareas de comprensión y recuperación de datos.

Gyanendra Shrestha, Anna Pyayt, Michael Gubanov2026-03-06💻 cs

Scaling Laws for Reranking in Information Retrieval

Este trabajo presenta el primer estudio sistemático de las leyes de escalado para los sistemas de reordenamiento en la recuperación de información, demostrando que el rendimiento de modelos de mayor tamaño puede predecirse con precisión a partir de experimentos a menor escala mediante el análisis de métricas como NDCG y MAP, lo que permite optimizar significativamente los recursos computacionales en sistemas industriales.

Rahul Seetharaman, Aman Bansal, Hamed Zamani + 1 more2026-03-06💻 cs

Detecting RAG Advertisements Across Advertising Styles

Este artículo presenta una nueva taxonomía de estilos publicitarios para sistemas de generación aumentada por recuperación (RAG) impulsados por modelos de lenguaje, demostrando que los modelos de reconocimiento de entidades son efectivos y robustos para detectar y localizar anuncios generados, mientras que los modelos ligeros resultan frágiles ante cambios en el estilo publicitario.

Sebastian Heineking, Wilhelm Pertsch, Ines Zelch + 4 more2026-03-06💻 cs

Leveraging Large Language Models for Semantic Query Processing in a Scholarly Knowledge Graph

Esta investigación propone un sistema innovador que integra Modelos de Lenguaje Grandes (LLM) con el Grafo de Conocimiento Académico de la ANU y un modelo de documentos profundos para procesar consultas semánticas complejas sobre la producción científica en ciencias de la computación, logrando una mayor precisión y eficiencia en la recuperación de información que los métodos tradicionales.

Runsong Jia, Bowen Zhang, Sergio J. Rodríguez Méndez + 1 more2026-03-05🤖 cs.AI

When Relevance Meets Novelty: Dual-Stable Periodic Optimization for Serendipitous Recommendation

Este artículo presenta CoEA, un método de recomendación serendípica que supera las limitaciones de los sistemas tradicionales y de los marcos actuales basados en LLM mediante el módulo DSIE para modelar intereses grupales e individuales y el mecanismo PCO para lograr una optimización dinámica en bucle cerrado que equilibra relevancia y novedad.

Hongxiang Lin, Hao Guo, Zeshun Li + 6 more2026-03-05🤖 cs.AI

REVISION:Reflective Intent Mining and Online Reasoning Auxiliary for E-commerce Visual Search System Optimization

El marco REVISION optimiza la búsqueda visual en el comercio electrónico de Taobao integrando la minería de intenciones implícitas mediante modelos grandes en una fase offline con la ejecución de decisiones adaptativas en línea, logrando así reducir significativamente la tasa de solicitudes sin clics al resolver la discrepancia entre las intenciones del usuario y la respuesta del sistema.

Yiwen Tang, Qiuyu Zhao, Zenghui Sun + 3 more2026-03-05🤖 cs.AI

Succeeding at Scale: Automated Dataset Construction and Query-Side Adaptation for Multi-Tenant Search

El artículo presenta DevRev-Search, un marco que combina una tubería automatizada de construcción de datos con una estrategia de adaptación que preserva el índice (ajustando solo el codificador de consultas), permitiendo la adaptación eficiente y escalable de sistemas de búsqueda empresarial multiinquilino sin necesidad de reindexación costosa.

Prateek Jain, Shabari S Nair, Ritesh Goru + 4 more2026-03-05🤖 cs.AI