cs.IR articoli | Gist.Science

HCT-QA: A Benchmark for Question Answering on Human-Centric Tables

Il paper propone HCT-QA, un nuovo benchmark completo per la risposta alle domande su tabelle complesse e orientate all'uomo (HCT), che include migliaia di esempi reali e sintetici per valutare e migliorare le prestazioni di modelli linguistici e visivi.

Mohammad S. Ahmad, Zan A. Naeem, Michaël Aupetit, Ahmed Elmagarmid, Mohamed Eltabakh, Xiaosong Ma, Mourad Ouzzani, Chaoyi Ruan, Hani Al-SayehMon, 09 Ma🤖 cs.AI

RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentanglement

Il paper presenta RED, una rete di deblurring guidata da eventi che migliora la robustezza e le prestazioni nel ripristino di immagini sfocate attraverso una strategia di perturbazione orientata alla robustezza e un meccanismo di disentanglement delle rappresentazioni specifiche per modalità, permettendo una fusione selettiva che separa le informazioni utili dal rumore causato dalla sottostima degli eventi.

Yihong Leng, Siming Zheng, Jinwei Chen, Bo Li, Jiaojiao Li, Peng-Tao JiangMon, 09 Ma💻 cs

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

Il paper presenta GaiaFlow, un framework innovativo che ottimizza il compromesso tra precisione nella ricerca e sostenibilità ambientale attraverso un'architettura di tuning guidato dalla semantica basata su diffusione, riducendo significativamente l'impronta di carbonio mantenendo elevate prestazioni di recupero.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon FongMon, 09 Ma🤖 cs.LG

Both Ends Count! Just How Good are LLM Agents at "Text-to-Big SQL"?

Questo articolo introduce nuove metriche per valutare l'efficacia degli agenti LLM nel generare SQL su grandi dataset ("Text-to-Big SQL"), dimostrando che le metriche tradizionali sono insufficienti per catturare costi, latenza e impatti legati alla scalabilità nei flussi di lavoro reali.

Germán T. Eizaguirre, Lars Tissen, Marc Sánchez-ArtigasMon, 09 Ma💬 cs.CL

Unified Learning-to-Rank for Multi-Channel Retrieval in Large-Scale E-Commerce Search

Questo articolo presenta un modello di apprendimento per il ranking unificato che, superando i limiti delle tradizionali tecniche di fusione, ottimizza la conversione degli utenti su Target.com integrando segnali comportamentali e obiettivi specifici per canale con un'architettura a bassa latenza.

Aditya Gaydhani, Guangyue Xu, Dhanush Kamath, Ankit Singh, Alex LiMon, 09 Ma💻 cs

Verify as You Go: An LLM-Powered Browser Extension for Fake News Detection

Questo articolo presenta Aletheia, un'estensione del browser basata su LLM e RAG che rileva le fake news fornendo spiegazioni trasparenti e strumenti interattivi per il coinvolgimento degli utenti, dimostrando superiorità nelle prestazioni e nell'usabilità rispetto alle soluzioni esistenti.

Dorsaf Sallami, Esma AïmeurMon, 09 Ma💬 cs.CL

VDCook:DIY video data cook your MLLMs

Il paper presenta VDCook, un sistema operativo auto-evolutivo per la costruzione dinamica e personalizzata di dataset video tramite query in linguaggio naturale, che integra recupero e sintesi controllata per abbattere le barriere all'addestramento di modelli multimediali in domini specifici.

Chengwei WuMon, 09 Ma🤖 cs.AI

AutothinkRAG: Complexity-Aware Control of Retrieval-Augmented Reasoning for Image-Text Interaction

Il paper presenta AutoThinkRAG, un framework che migliora il ragionamento su documenti complessi tramite un router di difficoltà delle query e un'architettura a decoupling funzionale che combina un piccolo modello visivo per l'interpretazione e un LLM per la deduzione, ottenendo prestazioni all'avanguardia con costi ridotti.

Jiashu Yang, Chi Zhang, Abudukelimu Wuerkaixi, Xuxin Cheng, Cao Liu, Ke Zeng, Xu Jia, Xunliang CaiMon, 09 Ma💻 cs

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

Il paper introduce CBR-to-SQL, un framework basato sul ragionamento per casi che supera le limitazioni dei metodi RAG tradizionali nel dominio sanitario, ottenendo risultati all'avanguardia nella traduzione da testo a SQL su dati EHR grazie a un processo di recupero a due stadi che migliora l'efficienza e la robustezza anche in condizioni di scarsità di dati.

Hung Nguyen, Hans Moen, Pekka MarttinenMon, 09 Ma🤖 cs.AI

The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok

Questo studio dimostra che, sebbene TikTok rispetti formalmente il divieto di pubblicità profilata ai minori previsto dal DSA, aggira tale protezione sfruttando una definizione restrittiva di "pubblicità" che esclude i contenuti promozionali degli influencer, consentendo così una profilazione commerciale nascosta e altamente mirata verso gli adolescenti.

Sara Solarova, Matej Mosnar, Matus Tibensky, Jan Jakubcik, Adrian Bindas, Simon Liska, Filip Hossner, Matúš Mesarčík, Ivan SrbaMon, 09 Ma🤖 cs.AI

Balancing Domestic and Global Perspectives: Evaluating Dual-Calibration and LLM-Generated Nudges for Diverse News Recommendation

Questo studio valuta l'efficacia di un framework di "nudge" personalizzato per la diversità, combinando un algoritmo di calibrazione duale e suggerimenti generati da LLM, dimostrando che tali interventi possono aumentare la diversità di consumo delle notizie e influenzare positivamente le abitudini di lettura degli utenti verso un equilibrio tra notizie nazionali e internazionali.

Ruixuan Sun, Matthew Zent, Minzhu Zhao, Thanmayee Boyapati, Xinyi Li, Joseph A. KonstanMon, 09 Ma🤖 cs.AI

Sensitivity-Aware Retrieval-Augmented Intent Clarification

Questo articolo propone un approccio in tre fasi per sviluppare agenti conversazionali di chiarimento dell'intento potenziati dalla ricerca, che agiscano come mediatori sicuri per collezioni di dati sensibili (come in ambito sanitario o legale) definendo modelli di attacco, progettando difese specifiche e valutando il compromesso tra protezione e utilità del sistema.

Maik LarooijMon, 09 Ma🤖 cs.AI

ChatShopBuddy: Towards Reliable Conversational Shopping Agents via Reinforcement Learning

Il paper presenta ChatShopBuddy, un agente conversazionale per lo shopping ottimizzato tramite apprendimento per rinforzo che utilizza il benchmark SmartShopBench, la modellazione gerarchica delle ricompense (HRM) e l'ottimizzazione dinamica delle politiche contrastive (DCPO) per bilanciare efficacemente accuratezza, persuasione ed efficienza operativa.

Yiruo Cheng, Kelong Mao, Tianhao Li, Jiejun Tan, Ji-Rong Wen, Zhicheng DouMon, 09 Ma💻 cs

Efficient Vector Search in the Wild: One Model for Multi-K Queries

Il paper presenta OMEGA, un metodo di ricerca appresa top-K generalizzabile a diverse dimensioni K che, addestrato principalmente su K=1 con caratteristiche basate su traiettorie e un procedimento di raffinamento dinamico, supera i metodi esistenti offrendo minore latenza e costi di pre-elaborazione ridotti senza compromettere l'accuratezza.

Yifan Peng, Jiafei Fan, Xingda Wei, Sijie Shen, Rong Chen, Jianning Wang, Xiaojian Luo, Wenyuan Yu, Jingren Zhou, Haibo ChenMon, 09 Ma🤖 cs.LG

MLLMRec-R1: Incentivizing Reasoning Capability in Large Language Models for Multimodal Sequential Recommendation

Il paper presenta MLLMRec-R1, un framework efficiente basato su GRPO che supera le sfide computazionali e di allineamento dei reward nella raccomandazione sequenziale multimodale trasformando i segnali visivi in testo e ottimizzando la supervisione del ragionamento, ottenendo prestazioni superiori rispetto agli stati dell'arte su diversi dataset.

Yu Wang, Yonghui Yang, Le Wu, Jiancan Wu, Hefei Xu, Hui LinMon, 09 Ma💻 cs

Efficient, Property-Aligned Fan-Out Retrieval via RL-Compiled Diffusion

Il paper propone R4T, un metodo che utilizza l'apprendimento per rinforzo una sola volta per generare dati di addestramento allineati agli obiettivi, permettendo di addestrare un recuperatore basato su diffusione leggero che risolve efficientemente problemi di recupero a ventaglio ottimizzando proprietà di insieme come diversità e coerenza con una latenza significativamente ridotta.

Pengcheng Jiang, Judith Yue Li, Moonkyung Ryu, R. Lily Hu, Kun Su, Zhong Yi Wan, Liam Hebert, Hao Peng, Jiawei Han, Dima Kuzmin, Craig BoutilierMon, 09 Ma🤖 cs.LG

CARROT: A Learned Cost-Constrained Retrieval Optimization System for RAG

Il paper presenta CARROT, un sistema di ottimizzazione della ricerca per RAG che utilizza la Ricerca ad Albero Monte Carlo e un agente di configurazione per selezionare e ordinare in modo ottimale i chunk di conoscenza, superando limiti come la ridondanza e la non monotonicità dell'utilità per migliorare l'accuratezza e l'efficienza della generazione.

Ziting Wang, Haitao Yuan, Wei Dong, Gao Cong, Feifei LiFri, 13 Ma💬 cs.CL

Tuning-Free LLM Can Build A Strong Recommender Under Sparse Connectivity And Knowledge Gap Via Extracting Intent

Il paper presenta IKGR, un framework di raccomandazione basato su LLM senza tuning che costruisce un grafo della conoscenza incentrato sulle intenzioni estratte tramite RAG per migliorare le prestazioni in scenari di sparsità e cold-start.

Wenqing Zheng, Noah Fatsi, Daniel Barcklow, Dmitri Kalaev, Steven Yao, Owen Reinert, C. Bayan Bruss, Daniele RosaFri, 13 Ma🤖 cs.AI

Refine-POI: Reinforcement Fine-Tuned Large Language Models for Next Point-of-Interest Recommendation

Il paper propone Refine-POI, un framework che migliora la raccomandazione del prossimo punto di interesse utilizzando una quantizzazione SOM gerarchica per ID semantici topologicamente consapevoli e un addestramento per rinforzo per generare liste di top-k, superando così i limiti delle metodologie esistenti.

Peibo Li, Shuang Ao, Hao Xue, Yang Song, Maarten de Rijke, Johan Barthélemy, Tomasz Bednarz, Flora D. SalimFri, 13 Ma🤖 cs.LG

Seq vs Seq: An Open Suite of Paired Encoders and Decoders

Questo lavoro introduce la suite Ettin, un insieme open-source di modelli encoder-only e decoder-only accoppiati e addestrati con la stessa ricetta su dati massicci, che dimostra come le architetture specializzate superino i modelli adattati incrociatamente per compiti specifici, fornendo allo stesso tempo un dataset completo di checkpoint e dati per la ricerca futura.

Orion Weller, Kathryn Ricci, Marc Marone, Antoine Chaffin, Dawn Lawrie, Benjamin Van DurmeFri, 13 Ma💬 cs.CL

← Precedente Successivo →