cs.IR artículos | Gist.Science

HCT-QA: A Benchmark for Question Answering on Human-Centric Tables

Este artículo presenta HCT-QA, un nuevo benchmark exhaustivo para la respuesta a preguntas sobre tablas centradas en humanos (HCTs) que incluye miles de tablas reales y sintéticas con sus correspondientes pares de preguntas y respuestas, evaluando el rendimiento de diversos modelos de lenguaje y visión y demostrando que el ajuste fino mejora significativamente la precisión.

Mohammad S. Ahmad, Zan A. Naeem, Michaël Aupetit, Ahmed Elmagarmid, Mohamed Eltabakh, Xiaosong Ma, Mourad Ouzzani, Chaoyi Ruan, Hani Al-SayehMon, 09 Ma🤖 cs.AI

RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentanglement

El artículo presenta RED, una red de desenfoque de movimiento guiada por eventos que mejora la robustez ante la subnotificación de eventos mediante una estrategia de perturbación orientada a la robustez y un mecanismo de desentrelazamiento de representaciones específicas de modalidad para fusionar selectivamente la información semántica y de movimiento.

Yihong Leng, Siming Zheng, Jinwei Chen, Bo Li, Jiaojiao Li, Peng-Tao JiangMon, 09 Ma💻 cs

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

GaiaFlow es un marco innovador que utiliza ajuste de difusión guiado semánticamente, dinámicas de Langevin y cuantización adaptativa para lograr una búsqueda neuronal sostenible que equilibra la precisión de recuperación con la eficiencia energética y la reducción de la huella de carbono.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon FongMon, 09 Ma🤖 cs.LG

Both Ends Count! Just How Good are LLM Agents at "Text-to-Big SQL"?

Este artículo introduce nuevas métricas y evalúa agentes LLM para el campo de "Text-to-Big SQL", demostrando que las métricas tradicionales de Text-to-SQL son insuficientes para entornos de datos a gran escala donde los errores de traducción generan costos y latencia significativos.

Germán T. Eizaguirre, Lars Tissen, Marc Sánchez-ArtigasMon, 09 Ma💬 cs.CL

Unified Learning-to-Rank for Multi-Channel Retrieval in Large-Scale E-Commerce Search

Este artículo propone un modelo unificado de aprendizaje para clasificar que fusiona dinámicamente resultados de múltiples canales de recuperación en la búsqueda de comercio electrónico, superando a los métodos tradicionales y logrando una mejora del 2,85 % en la conversión de usuarios al ser desplegado en Target.com.

Aditya Gaydhani, Guangyue Xu, Dhanush Kamath, Ankit Singh, Alex LiMon, 09 Ma💻 cs

Verify as You Go: An LLM-Powered Browser Extension for Fake News Detection

El artículo presenta Aletheia, una extensión de navegador impulsada por modelos de lenguaje grandes y generación aumentada por recuperación que detecta noticias falsas con explicaciones basadas en evidencia, supera a los métodos actuales en rendimiento y demuestra su utilidad y transparencia en un estudio con 250 usuarios.

Dorsaf Sallami, Esma AïmeurMon, 09 Ma💬 cs.CL

VDCook:DIY video data cook your MLLMs

El artículo presenta VDCook, un sistema operativo de datos de video autoevolutivo que permite a investigadores y equipos especializados generar, actualizar y gestionar conjuntos de datos de entrenamiento para modelos multimodales mediante consultas en lenguaje natural y un mecanismo automatizado de ingestión basado en el Protocolo de Contexto de Modelo (MCP).

Chengwei WuMon, 09 Ma🤖 cs.AI

AutothinkRAG: Complexity-Aware Control of Retrieval-Augmented Reasoning for Image-Text Interaction

El artículo presenta AutoThinkRAG, un marco que mejora la respuesta a preguntas en documentos complejos mediante un enrutador de complejidad de consultas y una arquitectura de desacoplamiento funcional que combina un modelo visual pequeño con un LLM, logrando un rendimiento superior y menores costos de inferencia.

Jiashu Yang, Chi Zhang, Abudukelimu Wuerkaixi, Xuxin Cheng, Cao Liu, Ke Zeng, Xu Jia, Xunliang CaiMon, 09 Ma💻 cs

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

El artículo presenta CBR-to-SQL, un marco basado en razonamiento basado en casos que supera las limitaciones de los enfoques RAG estándar en el dominio de la salud mediante un proceso de recuperación en dos etapas y plantillas abstractas, logrando mayor precisión, eficiencia de muestras y robustez en la traducción de preguntas naturales a SQL para bases de datos de registros electrónicos de salud.

Hung Nguyen, Hans Moen, Pekka MarttinenMon, 09 Ma🤖 cs.AI

The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok

Este estudio revela que, aunque TikTok cumple formalmente con la prohibición de la Ley de Servicios Digitales de mostrar publicidad basada en perfiles a menores, el algoritmo sigue exponiéndolos a una publicidad encubierta e influidora altamente personalizada que evade la regulación debido a una definición legal demasiado estrecha de "anuncio".

Sara Solarova, Matej Mosnar, Matus Tibensky, Jan Jakubcik, Adrian Bindas, Simon Liska, Filip Hossner, Matúš Mesarčík, Ivan SrbaMon, 09 Ma🤖 cs.AI

Balancing Domestic and Global Perspectives: Evaluating Dual-Calibration and LLM-Generated Nudges for Diverse News Recommendation

Este estudio evalúa un marco de empujes personalizados que combina un algoritmo de calibración dual de temas y localización con nudges generados por modelos de lenguaje grande, demostrando mediante un experimento de cinco semanas que las intervenciones algorítmicas aumentan efectivamente la diversidad de consumo de noticias domésticas y mundiales, mientras que la relevancia personalizada supera a la personalización genérica.

Ruixuan Sun, Matthew Zent, Minzhu Zhao, Thanmayee Boyapati, Xinyi Li, Joseph A. KonstanMon, 09 Ma🤖 cs.AI

Sensitivity-Aware Retrieval-Augmented Intent Clarification

Este artículo propone un marco de investigación en tres pasos para desarrollar agentes conversacionales de aclaración de intenciones aumentados por recuperación que protejan la información sensible en dominios críticos, definiendo modelos de ataque, diseñando defensas y evaluando el equilibrio entre protección y utilidad.

Maik LarooijMon, 09 Ma🤖 cs.AI

ChatShopBuddy: Towards Reliable Conversational Shopping Agents via Reinforcement Learning

Este trabajo presenta a ChatShopBuddy, un agente conversacional de compras optimizado mediante aprendizaje por refuerzo que utiliza el nuevo benchmark SmartShopBench, la modelación de recompensas jerárquica (HRM) y la optimización de políticas de contraste dinámica (DCPO) para equilibrar eficazmente múltiples objetivos objetivos y subjetivos en escenarios reales.

Yiruo Cheng, Kelong Mao, Tianhao Li, Jiejun Tan, Ji-Rong Wen, Zhicheng DouMon, 09 Ma💻 cs

Efficient Vector Search in the Wild: One Model for Multi-K Queries

El artículo presenta OMEGA, un método de búsqueda aprendida que generaliza a múltiples valores de K con alta precisión y rendimiento, utilizando un modelo base entrenado en K=1 y un procedimiento de refinamiento dinámico para reducir significativamente la latencia y los costos de preprocesamiento en comparación con los métodos actuales.

Yifan Peng, Jiafei Fan, Xingda Wei, Sijie Shen, Rong Chen, Jianning Wang, Xiaojian Luo, Wenyuan Yu, Jingren Zhou, Haibo ChenMon, 09 Ma🤖 cs.LG

MLLMRec-R1: Incentivizing Reasoning Capability in Large Language Models for Multimodal Sequential Recommendation

El artículo presenta MLLMRec-R1, un marco de razonamiento eficiente y estable basado en GRPO para la recomendación secuencial multimodal que supera los desafíos de costo computacional y la inflación de recompensas mediante la textualización de señales visuales, la construcción de cadenas de pensamiento de alta calidad y una estrategia de aumento de datos de granulación mixta.

Yu Wang, Yonghui Yang, Le Wu, Jiancan Wu, Hefei Xu, Hui LinMon, 09 Ma💻 cs

Efficient, Property-Aligned Fan-Out Retrieval via RL-Compiled Diffusion

El artículo presenta R4T, un marco que utiliza el aprendizaje por refuerzo para sintetizar datos de entrenamiento alineados con objetivos de conjunto y entrena un recuperador difusivo ligero, logrando así una recuperación eficiente de múltiples resultados con propiedades optimizadas y una latencia significativamente reducida en comparación con los métodos basados en LLM.

Pengcheng Jiang, Judith Yue Li, Moonkyung Ryu, R. Lily Hu, Kun Su, Zhong Yi Wan, Liam Hebert, Hao Peng, Jiawei Han, Dima Kuzmin, Craig BoutilierMon, 09 Ma🤖 cs.LG

CARROT: A Learned Cost-Constrained Retrieval Optimization System for RAG

El paper presenta CARROT, un sistema de optimización de recuperación para RAG que utiliza Búsqueda por Árbol Monte Carlo y un agente de configuración para seleccionar y ordenar óptimamente fragmentos de conocimiento, mejorando la precisión y adaptabilidad de los modelos de lenguaje grandes hasta en un 30% frente a enfoques existentes.

Ziting Wang, Haitao Yuan, Wei Dong, Gao Cong, Feifei LiFri, 13 Ma💬 cs.CL

Tuning-Free LLM Can Build A Strong Recommender Under Sparse Connectivity And Knowledge Gap Via Extracting Intent

El artículo presenta IKGR, un marco de recomendación basado en LLMs que, sin necesidad de ajuste fino, construye un grafo de conocimiento centrado en intenciones extraídas mediante RAG para superar la escasez de datos y los problemas de arranque en frío, logrando un rendimiento superior en escenarios de cola larga mediante una estrategia de densificación de conectividad mutua y una capa ligera de GNN.

Wenqing Zheng, Noah Fatsi, Daniel Barcklow, Dmitri Kalaev, Steven Yao, Owen Reinert, C. Bayan Bruss, Daniele RosaFri, 13 Ma🤖 cs.AI

Refine-POI: Reinforcement Fine-Tuned Large Language Models for Next Point-of-Interest Recommendation

El artículo presenta Refine-POI, un marco que mejora la recomendación de puntos de interés mediante la generación de identificadores semánticos conscientes de la topología y el ajuste fino por refuerzo para optimizar listas de recomendaciones, superando así las limitaciones de los métodos existentes.

Peibo Li, Shuang Ao, Hao Xue, Yang Song, Maarten de Rijke, Johan Barthélemy, Tomasz Bednarz, Flora D. SalimFri, 13 Ma🤖 cs.LG

Seq vs Seq: An Open Suite of Paired Encoders and Decoders

El artículo presenta la suite de modelos Ettin, un conjunto de pares de codificadores y decodificadores entrenados con la misma receta que establecen nuevos estándares en sus respectivas categorías y demuestran que adaptar un modelo al objetivo inverso es inferior a utilizar arquitecturas nativas para tareas específicas.

Orion Weller, Kathryn Ricci, Marc Marone, Antoine Chaffin, Dawn Lawrie, Benjamin Van DurmeFri, 13 Ma💬 cs.CL

← Anterior Siguiente →