TURA: Tool-Augmented Unified Retrieval Agent for AI Search

Il paper presenta TURA, un agente di ricerca AI unificato che integra la generazione aumentata dal recupero (RAG) con l'uso di strumenti agenziali per superare i limiti dei sistemi tradizionali, consentendo l'accesso in tempo reale sia a contenuti statici che a dati dinamici attraverso un'architettura a tre stadi ottimizzata per l'uso industriale su larga scala.

Zhejun Zhao, Yuchen Li, Alley Liu, Yuehu Dong, Xiaolong Wei, Lixue Zheng, Pingsheng Liu, Dongdong Shen, Long Xia, Jiashu Zhao, Dawei YinFri, 13 Ma💬 cs.CL

Mobile-Agent-RAG: Driving Smart Multi-Agent Coordination with Contextual Knowledge Empowerment for Long-Horizon Mobile Automation

Il paper propone Mobile-Agent-RAG, un innovativo framework multi-agente gerarchico che integra un'arricchimento contestuale a doppio livello (Manager-RAG per la pianificazione strategica e Operator-RAG per l'esecuzione operativa) per superare le limitazioni degli agenti mobili attuali, riducendo le allucinazioni e gli errori di esecuzione nei compiti a lungo raggio attraverso l'uso di basi di conoscenza specializzate.

Yuxiang Zhou, Jichang Li, Yanhao Zhang, Haonan Lu, Guanbin LiFri, 13 Ma🤖 cs.AI

PosIR: Position-Aware Heterogeneous Information Retrieval Benchmark

Il paper introduce PosIR, il primo benchmark standardizzato multilingue e multidominio progettato per diagnosticare sistematicamente il bias posizionale nei modelli di recupero informazioni, rivelando attraverso esperimenti su dieci modelli all'avanguardia che tale pregiudizio è pervasivo, spesso correlato negativamente alle valutazioni su testi brevi e legato a specifici meccanismi interni del modello.

Ziyang Zeng, Dun Zhang, Yu Yan, Xu Sun, Cuiqiaoshu Pan, Yudong Zhou, Yuqing YangFri, 13 Ma💬 cs.CL

OpenSanctions Pairs: Large-Scale Entity Matching with LLMs

Il paper introduce OpenSanctions Pairs, un ampio benchmark per l'abbinamento di entità derivato da dati reali sulle sanzioni internazionali, dimostrando che i modelli linguistici (LLM) superano significativamente i sistemi basati su regole e che le prestazioni stanno raggiungendo un limite pratico, suggerendo un futuro spostamento degli sforzi verso componenti della pipeline come il blocco e il clustering.

Chandler Smith, Magnus Sesodia, Friedrich Lindenberg, Christian Schroeder de WittFri, 13 Ma💬 cs.CL

MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries

Il paper propone MDER-DR, un framework di Question Answering basato su Knowledge Graph che combina un nuovo approccio di indicizzazione (MDER) e un meccanismo di recupero (DR) per superare i limiti dei sistemi RAG tradizionali, ottenendo miglioramenti significativi nelle risposte a domande multi-hop senza richiedere una traversa esplicita del grafo.

Riccardo Campi, Nicolò Oreste Pinciroli Vago, Mathyas Giudici, Marco Brambilla, Piero FraternaliFri, 13 Ma💬 cs.CL

How Auditing Methodologies Can Impact Our Understanding of YouTube's Recommendation Systems

Questo studio dimostra che le scelte metodologiche negli audit di YouTube, come l'uso di account loggati, influenzano significativamente l'accuratezza delle inferenze sui bias dei sistemi di raccomandazione, offrendo al contempo strategie per ridurre i costi computazionali ed economici senza compromettere la validità scientifica dei risultati.

Sarmad Chandio, Daniyal Pirwani Dar, Rishab Nithyanand2026-03-10💻 cs

A Scalable Inter-edge Correlation Modeling in CopulaGNN for Link Sign Prediction

Il documento propone un metodo scalabile per la previsione del segno dei link nei grafi firmati che, estendendo CopulaGNN, modella le dipendenze statistiche tra gli archi tramite una matrice di correlazione a basso rango e una riformulazione della probabilità condizionata, garantendo così una convergenza lineare e prestazioni competitive con costi computazionali ridotti.

Jinkyu Sung, Myunggeum Jee, Joonseok Lee2026-03-06💻 cs

SearchGym: A Modular Infrastructure for Cross-Platform Benchmarking and Hybrid Search Orchestration

Il paper presenta SearchGym, un'infrastruttura modulare open-source che colma il divario tra prototipi sperimentali e sistemi di produzione per il RAG, permettendo il benchmarking cross-platform e l'orchestrazione ibrida attraverso astrazioni disaccoppiate e un'algebra di configurazione composita, con risultati che evidenziano come l'ottimizzazione ingegneristica possa rivelare meccanismi causali fondamentali nel recupero dell'informazione.

Jerome Tze-Hou Hsu2026-03-06💻 cs