cs.IR articoli | Gist.Science

ThinkQE: Query Expansion via an Evolving Thinking Process

Il paper presenta ThinkQE, un framework di espansione delle query che supera i limiti dei metodi LLM esistenti integrando un processo di ragionamento approfondito e una strategia di interazione iterativa con il corpus per migliorare la diversità e la copertura semantica nei risultati di ricerca web.

Yibin Lei, Tao Shen, Andrew YatesWed, 11 Ma💬 cs.CL

TaoSR1: The Thinking Model for E-commerce Relevance Search

Il paper presenta TaoSR1, un framework che adatta i Large Language Models per la ricerca di rilevanza nell'e-commerce attraverso un processo in tre fasi di addestramento con Chain-of-Thought e ottimizzazione delle preferenze, risolvendo problemi di allucinazione e fattibilità di deployment per ottenere prestazioni superiori rispetto ai modelli basati su BERT.

Chenhe Dong, Shaowei Yao, Pengkun Jiao, Jianhui Yang, Yiming Jin, Zerui Huang, Xiaojiang Zhou, Dan Ou, Haihong Tang, Bo ZhengWed, 11 Ma🤖 cs.AI

Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

Il paper presenta ELERAG, un'architettura RAG potenziata dal Linking di Entità e da una strategia di riordinamento ibrida, che dimostra come l'integrazione di segnali fattuali basati su Wikidata migliori significativamente l'accuratezza nei sistemi di domanda-risposta educativi in italiano, superando i metodi tradizionali nei contesti specifici di dominio pur mantenendo prestazioni competitive su dataset generali.

Francesco Granata, Francesco Poggi, Misael MongiovìWed, 11 Ma🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

Il paper presenta MCGI, un metodo di indicizzazione basato su grafi che risolve il problema della discrepanza tra metriche euclidee e geodetiche nei dati ad alta dimensionalità sfruttando la dimensionalità intrinseca locale per adattarsi dinamicamente alla geometria dei dati, ottenendo prestazioni superiori e scalabilità fino al miliardo di record su dischi.

Dongfang ZhaoWed, 11 Ma🤖 cs.AI

Scaling Multilingual Semantic Search in Uber Eats Delivery

Questo articolo presenta un sistema di recupero semantico multilingue e multi-verticale per Uber Eats, basato su un modello Qwen2 fine-tunato con tecniche avanzate di apprendimento su larga scala, che ha ottenuto significativi miglioramenti nel recall rispetto ai baseline esistenti.

Bo Ling, Zheng Liu, Haoyang Chen, Divya Nagar, Luting Yang, Mehul ParsanaWed, 11 Ma💻 cs

Time warping with Hellinger elasticity

Il documento presenta l'algoritmo Elastic Time Warping, che risolve il problema di allineamento di serie temporali in spazi metrici arbitrari utilizzando una penalità basata sul kernel di Hellinger con una complessità computazionale cubica.

Yuly BilligWed, 11 Ma💻 cs

Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage

Lo studio dimostra che le metriche di recupero basate sulla copertura sono forti indicatori predittivi della completezza informativa nelle risposte generate dai sistemi RAG, specialmente quando gli obiettivi di recupero e generazione sono allineati.

Saron Samuel, Alexander Martin, Eugene Yang, Andrew Yates, Dawn Lawrie, Ian Soborof, Laura Dietz, Benjamin Van DurmeWed, 11 Ma🤖 cs.AI

Quantifying Uncertainty in AI Visibility: A Statistical Framework for Generative Search Measurement

Questo studio dimostra che le metriche di visibilità nei motori di ricerca generativi sono intrinsecamente variabili e non deterministiche, sostenendo la necessità di adottare un framework statistico che includa stime di incertezza e intervalli di confidenza invece di affidarsi a misurazioni puntuali singole.

Ronald SielinskiWed, 11 Ma🤖 cs.AI

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

Il paper presenta "Guardian", un sistema di supporto decisionale che combina catene di Markov interpretabili, apprendimento per rinforzo e modelli linguistici di grandi dimensioni per generare piani di ricerca ottimali e verificabili per la localizzazione di minori scomparsi entro le prime 72 ore.

Joshua Castillo, Ravi MukkamalaWed, 11 Ma🤖 cs.AI

PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration

Il paper presenta PathoScribe, un framework unificato basato su modelli linguistici di grandi dimensioni (LLM) che trasforma gli archivi di patologia statici in una "biblioteca vivente" interattiva, abilitando il recupero semantico, il ragionamento clinico e la costruzione automatizzata di coorti di ricerca con elevata precisione ed efficienza.

Abdul Rehman Akbar, Samuel Wales-McGrath, Alejadro Levya, Lina Gokhale, Rajendra Singh, Wei Chen, Anil Parwani, Muhammad Khalid Khan NiaziWed, 11 Ma🤖 cs.AI

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

Il documento presenta "Guardian", un sistema end-to-end basato su un pipeline multi-LLM che, attraverso l'uso di modelli specializzati, un motore di consenso e il fine-tuning QLoRA, supporta le indagini su persone scomparse e la pianificazione delle ricerche con un approccio conservativo e verificabile.

Joshua Castillo, Ravi MukkamalaWed, 11 Ma🤖 cs.AI

Unlocking High-Fidelity Analog Joint Source-Channel Coding on Standard Digital Transceivers

Il paper presenta D2AJSCC, un nuovo framework che permette di implementare la codifica congiunta sorgente-canale analogica ad alta fedeltà su trasmettitori digitali standard, superando le limitazioni hardware tramite l'inversione computazionale della PHY e l'uso di una rete neurale surrogata differenziabile per garantire un addestramento end-to-end senza modifiche all'infrastruttura esistente.

Shumin Yao, Hao Chen, Yaping Sun, Nan Ma, Xiaodong Xu, Qinglin Zhao, Shuguang CuiWed, 11 Ma🔢 math

From Verification to Amplification: Auditing Reverse Image Search as Algorithmic Gatekeeping in Visual Misinformation Fact-checking

Questo studio evidenzia come la ricerca inversa di immagini di Google, utilizzata per la verifica delle notizie, funzioni come un gatekeeper algoritmico che spesso fallisce nel promuovere contenuti di smentita a causa della prevalenza di informazioni irrilevanti e della presenza di "vuoti di dati" all'insorgenza di disinformazione visiva.

Cong Lin, Yifei Chen, Jiangyue Chen, Yingdan Lu, Yilang Peng, Cuihua ShenWed, 11 Ma💻 cs

DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering

Il paper presenta DataFactory, un framework collaborativo multi-agente che supera le limitazioni dei modelli linguistici esistenti nelle risposte a domande su tabelle, combinando un coordinatore ReAct, team specializzati per database e grafi della conoscenza, e strategie di ingegneria del contesto per ottenere significativi miglioramenti di accuratezza e riduzione delle allucinazioni su diversi benchmark.

Tong Wang, Chi Jin, Yongkang Chen, Huan Deng, Xiaohui Kuang, Gang ZhaoWed, 11 Ma🤖 cs.AI

Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval

Il paper propone RF-Mem, un sistema di recupero della memoria per LLM personalizzati che, ispirandosi al processo duale umano di familiarità e rievocazione, adatta dinamicamente la strategia di ricerca per migliorare precisione e scalabilità superando i limiti dei metodi tradizionali.

Yingyi Zhang, Junyi Li, Wenlin Zhang, Penyue Jia, Xianneng Li, Yichao Wang, Derong Xu, Yi Wen, Huifeng Guo, Yong Liu, Xiangyu ZhaoWed, 11 Ma💻 cs

Diagnosing and Repairing Citation Failures in Generative Engine Optimization

Questo articolo introduce AgentGEO, un sistema agenziale che diagnostica e risolve le cause specifiche del mancato citamento dei documenti nell'ottimizzazione per motori generativi (GEO), ottenendo un miglioramento superiore del 40% nei tassi di citazione rispetto ai metodi basati su regole generiche.

Zhihua Tian, Yuhan Chen, Yao Tang, Jian Liu, Ruoxi JiaWed, 11 Ma💬 cs.CL

TA-Mem: Tool-Augmented Autonomous Memory Retrieval for LLM in Long-Term Conversational QA

Il paper presenta TA-Mem, un nuovo framework di recupero autonomo della memoria potenziato da strumenti per i Large Language Models, che supera le limitazioni delle finestre contestuali e dei metodi di recupero statici attraverso un agente di estrazione adattivo, un database indicizzato multipli e un agente di recupero autonomo, ottenendo risultati significativamente migliori sul dataset LoCoMo.

Mengwei Yuan, Jianan Liu, Jing Yang, Xianyou Li, Weiran Yan, Yichao Wu, Penghao LiangWed, 11 Ma💬 cs.CL

PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution

Il paper introduce PRECEPT, un quadro unificato per l'adattamento al momento del test che combina recupero deterministico di regole, memoria consapevole dei conflitti e un ciclo esterno guidato da Pareto (COMPASS) per migliorare significativamente la resilienza, la generalizzazione composizionale e la robustezza degli agenti LLM rispetto alla conoscenza obsoleta o avversaria.

Arash ShahmansooriWed, 11 Ma🤖 cs.AI

Understanding the Interplay between LLMs' Utilisation of Parametric and Contextual Knowledge: A keynote at ECIR 2025

Questo intervento all'ECIR 2025 esamina l'interazione tra la conoscenza parametrica e quella contestuale nei modelli linguistici, presentando ricerche su metodi di valutazione, test diagnostici per rilevare conflitti di conoscenza e le caratteristiche che favoriscono l'uso efficace del contesto.

Isabelle AugensteinWed, 11 Ma💬 cs.CL

Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records

Questo studio presenta un framework di classificazione automatizzata per la gestione del rischio cardiaco negli anziani, dimostrando che un'architettura Transformer personalizzata supera sia i metodi tradizionali che i modelli linguistici generici nell'analisi di lunghe storie cliniche non strutturate.

Jacopo Vitale, David Della Morte, Luca Bacco, Mario Merone, Mark de Groot, Saskia Haitjema, Leandro Pecchia, Bram van EsWed, 11 Ma🤖 cs.AI