HCT-QA: A Benchmark for Question Answering on Human-Centric Tables

Este artículo presenta HCT-QA, un nuevo benchmark exhaustivo para la respuesta a preguntas sobre tablas centradas en humanos (HCTs) que incluye miles de tablas reales y sintéticas con sus correspondientes pares de preguntas y respuestas, evaluando el rendimiento de diversos modelos de lenguaje y visión y demostrando que el ajuste fino mejora significativamente la precisión.

Mohammad S. Ahmad, Zan A. Naeem, Michaël Aupetit, Ahmed Elmagarmid, Mohamed Eltabakh, Xiaosong Ma, Mourad Ouzzani, Chaoyi Ruan, Hani Al-SayehMon, 09 Ma🤖 cs.AI

RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentanglement

El artículo presenta RED, una red de desenfoque de movimiento guiada por eventos que mejora la robustez ante la subnotificación de eventos mediante una estrategia de perturbación orientada a la robustez y un mecanismo de desentrelazamiento de representaciones específicas de modalidad para fusionar selectivamente la información semántica y de movimiento.

Yihong Leng, Siming Zheng, Jinwei Chen, Bo Li, Jiaojiao Li, Peng-Tao JiangMon, 09 Ma💻 cs

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

GaiaFlow es un marco innovador que utiliza ajuste de difusión guiado semánticamente, dinámicas de Langevin y cuantización adaptativa para lograr una búsqueda neuronal sostenible que equilibra la precisión de recuperación con la eficiencia energética y la reducción de la huella de carbono.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon FongMon, 09 Ma🤖 cs.LG

AutothinkRAG: Complexity-Aware Control of Retrieval-Augmented Reasoning for Image-Text Interaction

El artículo presenta AutoThinkRAG, un marco que mejora la respuesta a preguntas en documentos complejos mediante un enrutador de complejidad de consultas y una arquitectura de desacoplamiento funcional que combina un modelo visual pequeño con un LLM, logrando un rendimiento superior y menores costos de inferencia.

Jiashu Yang, Chi Zhang, Abudukelimu Wuerkaixi, Xuxin Cheng, Cao Liu, Ke Zeng, Xu Jia, Xunliang CaiMon, 09 Ma💻 cs

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

El artículo presenta CBR-to-SQL, un marco basado en razonamiento basado en casos que supera las limitaciones de los enfoques RAG estándar en el dominio de la salud mediante un proceso de recuperación en dos etapas y plantillas abstractas, logrando mayor precisión, eficiencia de muestras y robustez en la traducción de preguntas naturales a SQL para bases de datos de registros electrónicos de salud.

Hung Nguyen, Hans Moen, Pekka MarttinenMon, 09 Ma🤖 cs.AI

The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok

Este estudio revela que, aunque TikTok cumple formalmente con la prohibición de la Ley de Servicios Digitales de mostrar publicidad basada en perfiles a menores, el algoritmo sigue exponiéndolos a una publicidad encubierta e influidora altamente personalizada que evade la regulación debido a una definición legal demasiado estrecha de "anuncio".

Sara Solarova, Matej Mosnar, Matus Tibensky, Jan Jakubcik, Adrian Bindas, Simon Liska, Filip Hossner, Matúš Mesarčík, Ivan SrbaMon, 09 Ma🤖 cs.AI

Balancing Domestic and Global Perspectives: Evaluating Dual-Calibration and LLM-Generated Nudges for Diverse News Recommendation

Este estudio evalúa un marco de empujes personalizados que combina un algoritmo de calibración dual de temas y localización con nudges generados por modelos de lenguaje grande, demostrando mediante un experimento de cinco semanas que las intervenciones algorítmicas aumentan efectivamente la diversidad de consumo de noticias domésticas y mundiales, mientras que la relevancia personalizada supera a la personalización genérica.

Ruixuan Sun, Matthew Zent, Minzhu Zhao, Thanmayee Boyapati, Xinyi Li, Joseph A. KonstanMon, 09 Ma🤖 cs.AI

ChatShopBuddy: Towards Reliable Conversational Shopping Agents via Reinforcement Learning

Este trabajo presenta a ChatShopBuddy, un agente conversacional de compras optimizado mediante aprendizaje por refuerzo que utiliza el nuevo benchmark SmartShopBench, la modelación de recompensas jerárquica (HRM) y la optimización de políticas de contraste dinámica (DCPO) para equilibrar eficazmente múltiples objetivos objetivos y subjetivos en escenarios reales.

Yiruo Cheng, Kelong Mao, Tianhao Li, Jiejun Tan, Ji-Rong Wen, Zhicheng DouMon, 09 Ma💻 cs

Efficient Vector Search in the Wild: One Model for Multi-K Queries

El artículo presenta OMEGA, un método de búsqueda aprendida que generaliza a múltiples valores de K con alta precisión y rendimiento, utilizando un modelo base entrenado en K=1 y un procedimiento de refinamiento dinámico para reducir significativamente la latencia y los costos de preprocesamiento en comparación con los métodos actuales.

Yifan Peng, Jiafei Fan, Xingda Wei, Sijie Shen, Rong Chen, Jianning Wang, Xiaojian Luo, Wenyuan Yu, Jingren Zhou, Haibo ChenMon, 09 Ma🤖 cs.LG

MLLMRec-R1: Incentivizing Reasoning Capability in Large Language Models for Multimodal Sequential Recommendation

El artículo presenta MLLMRec-R1, un marco de razonamiento eficiente y estable basado en GRPO para la recomendación secuencial multimodal que supera los desafíos de costo computacional y la inflación de recompensas mediante la textualización de señales visuales, la construcción de cadenas de pensamiento de alta calidad y una estrategia de aumento de datos de granulación mixta.

Yu Wang, Yonghui Yang, Le Wu, Jiancan Wu, Hefei Xu, Hui LinMon, 09 Ma💻 cs

Efficient, Property-Aligned Fan-Out Retrieval via RL-Compiled Diffusion

El artículo presenta R4T, un marco que utiliza el aprendizaje por refuerzo para sintetizar datos de entrenamiento alineados con objetivos de conjunto y entrena un recuperador difusivo ligero, logrando así una recuperación eficiente de múltiples resultados con propiedades optimizadas y una latencia significativamente reducida en comparación con los métodos basados en LLM.

Pengcheng Jiang, Judith Yue Li, Moonkyung Ryu, R. Lily Hu, Kun Su, Zhong Yi Wan, Liam Hebert, Hao Peng, Jiawei Han, Dima Kuzmin, Craig BoutilierMon, 09 Ma🤖 cs.LG

Tuning-Free LLM Can Build A Strong Recommender Under Sparse Connectivity And Knowledge Gap Via Extracting Intent

El artículo presenta IKGR, un marco de recomendación basado en LLMs que, sin necesidad de ajuste fino, construye un grafo de conocimiento centrado en intenciones extraídas mediante RAG para superar la escasez de datos y los problemas de arranque en frío, logrando un rendimiento superior en escenarios de cola larga mediante una estrategia de densificación de conectividad mutua y una capa ligera de GNN.

Wenqing Zheng, Noah Fatsi, Daniel Barcklow, Dmitri Kalaev, Steven Yao, Owen Reinert, C. Bayan Bruss, Daniele RosaFri, 13 Ma🤖 cs.AI

Refine-POI: Reinforcement Fine-Tuned Large Language Models for Next Point-of-Interest Recommendation

El artículo presenta Refine-POI, un marco que mejora la recomendación de puntos de interés mediante la generación de identificadores semánticos conscientes de la topología y el ajuste fino por refuerzo para optimizar listas de recomendaciones, superando así las limitaciones de los métodos existentes.

Peibo Li, Shuang Ao, Hao Xue, Yang Song, Maarten de Rijke, Johan Barthélemy, Tomasz Bednarz, Flora D. SalimFri, 13 Ma🤖 cs.LG