RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentanglement

Il paper presenta RED, una rete di deblurring guidata da eventi che migliora la robustezza e le prestazioni nel ripristino di immagini sfocate attraverso una strategia di perturbazione orientata alla robustezza e un meccanismo di disentanglement delle rappresentazioni specifiche per modalità, permettendo una fusione selettiva che separa le informazioni utili dal rumore causato dalla sottostima degli eventi.

Yihong Leng, Siming Zheng, Jinwei Chen, Bo Li, Jiaojiao Li, Peng-Tao JiangMon, 09 Ma💻 cs

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

Il paper presenta GaiaFlow, un framework innovativo che ottimizza il compromesso tra precisione nella ricerca e sostenibilità ambientale attraverso un'architettura di tuning guidato dalla semantica basata su diffusione, riducendo significativamente l'impronta di carbonio mantenendo elevate prestazioni di recupero.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon FongMon, 09 Ma🤖 cs.LG

AutothinkRAG: Complexity-Aware Control of Retrieval-Augmented Reasoning for Image-Text Interaction

Il paper presenta AutoThinkRAG, un framework che migliora il ragionamento su documenti complessi tramite un router di difficoltà delle query e un'architettura a decoupling funzionale che combina un piccolo modello visivo per l'interpretazione e un LLM per la deduzione, ottenendo prestazioni all'avanguardia con costi ridotti.

Jiashu Yang, Chi Zhang, Abudukelimu Wuerkaixi, Xuxin Cheng, Cao Liu, Ke Zeng, Xu Jia, Xunliang CaiMon, 09 Ma💻 cs

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

Il paper introduce CBR-to-SQL, un framework basato sul ragionamento per casi che supera le limitazioni dei metodi RAG tradizionali nel dominio sanitario, ottenendo risultati all'avanguardia nella traduzione da testo a SQL su dati EHR grazie a un processo di recupero a due stadi che migliora l'efficienza e la robustezza anche in condizioni di scarsità di dati.

Hung Nguyen, Hans Moen, Pekka MarttinenMon, 09 Ma🤖 cs.AI

The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok

Questo studio dimostra che, sebbene TikTok rispetti formalmente il divieto di pubblicità profilata ai minori previsto dal DSA, aggira tale protezione sfruttando una definizione restrittiva di "pubblicità" che esclude i contenuti promozionali degli influencer, consentendo così una profilazione commerciale nascosta e altamente mirata verso gli adolescenti.

Sara Solarova, Matej Mosnar, Matus Tibensky, Jan Jakubcik, Adrian Bindas, Simon Liska, Filip Hossner, Matúš Mesarčík, Ivan SrbaMon, 09 Ma🤖 cs.AI

Balancing Domestic and Global Perspectives: Evaluating Dual-Calibration and LLM-Generated Nudges for Diverse News Recommendation

Questo studio valuta l'efficacia di un framework di "nudge" personalizzato per la diversità, combinando un algoritmo di calibrazione duale e suggerimenti generati da LLM, dimostrando che tali interventi possono aumentare la diversità di consumo delle notizie e influenzare positivamente le abitudini di lettura degli utenti verso un equilibrio tra notizie nazionali e internazionali.

Ruixuan Sun, Matthew Zent, Minzhu Zhao, Thanmayee Boyapati, Xinyi Li, Joseph A. KonstanMon, 09 Ma🤖 cs.AI

ChatShopBuddy: Towards Reliable Conversational Shopping Agents via Reinforcement Learning

Il paper presenta ChatShopBuddy, un agente conversazionale per lo shopping ottimizzato tramite apprendimento per rinforzo che utilizza il benchmark SmartShopBench, la modellazione gerarchica delle ricompense (HRM) e l'ottimizzazione dinamica delle politiche contrastive (DCPO) per bilanciare efficacemente accuratezza, persuasione ed efficienza operativa.

Yiruo Cheng, Kelong Mao, Tianhao Li, Jiejun Tan, Ji-Rong Wen, Zhicheng DouMon, 09 Ma💻 cs

Efficient Vector Search in the Wild: One Model for Multi-K Queries

Il paper presenta OMEGA, un metodo di ricerca appresa top-K generalizzabile a diverse dimensioni K che, addestrato principalmente su K=1 con caratteristiche basate su traiettorie e un procedimento di raffinamento dinamico, supera i metodi esistenti offrendo minore latenza e costi di pre-elaborazione ridotti senza compromettere l'accuratezza.

Yifan Peng, Jiafei Fan, Xingda Wei, Sijie Shen, Rong Chen, Jianning Wang, Xiaojian Luo, Wenyuan Yu, Jingren Zhou, Haibo ChenMon, 09 Ma🤖 cs.LG

MLLMRec-R1: Incentivizing Reasoning Capability in Large Language Models for Multimodal Sequential Recommendation

Il paper presenta MLLMRec-R1, un framework efficiente basato su GRPO che supera le sfide computazionali e di allineamento dei reward nella raccomandazione sequenziale multimodale trasformando i segnali visivi in testo e ottimizzando la supervisione del ragionamento, ottenendo prestazioni superiori rispetto agli stati dell'arte su diversi dataset.

Yu Wang, Yonghui Yang, Le Wu, Jiancan Wu, Hefei Xu, Hui LinMon, 09 Ma💻 cs

Efficient, Property-Aligned Fan-Out Retrieval via RL-Compiled Diffusion

Il paper propone R4T, un metodo che utilizza l'apprendimento per rinforzo una sola volta per generare dati di addestramento allineati agli obiettivi, permettendo di addestrare un recuperatore basato su diffusione leggero che risolve efficientemente problemi di recupero a ventaglio ottimizzando proprietà di insieme come diversità e coerenza con una latenza significativamente ridotta.

Pengcheng Jiang, Judith Yue Li, Moonkyung Ryu, R. Lily Hu, Kun Su, Zhong Yi Wan, Liam Hebert, Hao Peng, Jiawei Han, Dima Kuzmin, Craig BoutilierMon, 09 Ma🤖 cs.LG

CARROT: A Learned Cost-Constrained Retrieval Optimization System for RAG

Il paper presenta CARROT, un sistema di ottimizzazione della ricerca per RAG che utilizza la Ricerca ad Albero Monte Carlo e un agente di configurazione per selezionare e ordinare in modo ottimale i chunk di conoscenza, superando limiti come la ridondanza e la non monotonicità dell'utilità per migliorare l'accuratezza e l'efficienza della generazione.

Ziting Wang, Haitao Yuan, Wei Dong, Gao Cong, Feifei LiFri, 13 Ma💬 cs.CL

Refine-POI: Reinforcement Fine-Tuned Large Language Models for Next Point-of-Interest Recommendation

Il paper propone Refine-POI, un framework che migliora la raccomandazione del prossimo punto di interesse utilizzando una quantizzazione SOM gerarchica per ID semantici topologicamente consapevoli e un addestramento per rinforzo per generare liste di top-k, superando così i limiti delle metodologie esistenti.

Peibo Li, Shuang Ao, Hao Xue, Yang Song, Maarten de Rijke, Johan Barthélemy, Tomasz Bednarz, Flora D. SalimFri, 13 Ma🤖 cs.LG

Seq vs Seq: An Open Suite of Paired Encoders and Decoders

Questo lavoro introduce la suite Ettin, un insieme open-source di modelli encoder-only e decoder-only accoppiati e addestrati con la stessa ricetta su dati massicci, che dimostra come le architetture specializzate superino i modelli adattati incrociatamente per compiti specifici, fornendo allo stesso tempo un dataset completo di checkpoint e dati per la ricerca futura.

Orion Weller, Kathryn Ricci, Marc Marone, Antoine Chaffin, Dawn Lawrie, Benjamin Van DurmeFri, 13 Ma💬 cs.CL