LLM-FK: Multi-Agent LLM Reasoning for Foreign Key Detection in Large-Scale Complex Databases

Il paper presenta LLM-FK, un innovativo framework multi-agente automatizzato che supera i limiti dei metodi euristici e delle soluzioni LLM naive per il rilevamento di chiavi estere mancanti in database complessi su larga scala, ottenendo prestazioni superiori (F1 > 93%) attraverso una coordinazione specializzata di agenti che riduce drasticamente lo spazio di ricerca e garantisce coerenza globale.

Zijian Tang, Ying Zhang, Sibo Cai, Ruoxuan WangTue, 10 Ma💻 cs

Tursio for Credit Unions: Powering Structured Data Search with Automated Context Graph

Il documento presenta Tursio, una piattaforma di ricerca database sicura e on-premise per le cooperative di credito che utilizza modelli linguistici su larga scala per generare automaticamente un grafo della conoscenza contestuale, permettendo agli utenti aziendali di interrogare sistemi complessi tramite linguaggio naturale in modo conforme alle normative.

Shivani Tripathi, Ravi Shetye, Shi Qiao, Alekh JindalTue, 10 Ma💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

Il paper presenta Dial, un sistema NL2SQL basato sulla conoscenza che supera le limitazioni dei metodi esistenti nel gestire diversi dialetti SQL attraverso una pianificazione logica consapevole del dialetto, una base di conoscenza gerarchica e un ciclo di verifica semantica, dimostrando miglioramenti significativi nell'accuratezza e nella copertura delle funzionalità su un nuovo benchmark multi-database.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan WuTue, 10 Ma🤖 cs.LG

GP-Tree: An in-memory spatial index combining adaptive grid cells with a prefix tree for efficient spatial querying

Il paper presenta GP-Tree, un indice spaziale in memoria che combina celle di griglia adattive con una struttura ad albero di prefissi per superare i limiti delle approssimazioni tradizionali, offrendo una precisione di filtraggio superiore e prestazioni di query fino a un ordine di grandezza migliori rispetto agli indici spaziali esistenti.

Xiangyang Yang, Xuefeng Guan, Lanxue Dang, Yi Xie, Qingyang Xu, Huayi Wu, Jiayao WangTue, 10 Ma💻 cs

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

Il paper introduce Rel-MOSS, un nuovo approccio di apprendimento profondo relazionale che affronta il problema dello squilibrio delle classi nei database relazionali mediante un sintetizzatore di minoranza guidato dalle relazioni e un controllore di gate relazionale, ottenendo prestazioni superiori rispetto agli stati dell'arte su 12 dataset.

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi ZhangTue, 10 Ma🤖 cs.LG

Decomposition-Driven Multi-Table Retrieval and Reasoning for Numerical Question Answering

Il paper presenta DMRAL, un framework basato sulla decomposizione che supera le limitazioni delle soluzioni esistenti per il question answering numerico su grandi collezioni di tabelle, migliorando significativamente sia il recupero delle tabelle pertinenti che l'accuratezza delle risposte attraverso la costruzione di un grafo di relazioni, un decompositore di domande allineato alle tabelle e un ragionatore guidato da sottodomande.

Feng Luo, Hai Lan, Hui Luo, Zhifeng Bao, Xiaoli Wang, J. Shane Culpepper, Shazia SadiqTue, 10 Ma💻 cs

LLM-Driven Online Aggregation for Unstructured Text Analytics

Il paper presenta OLLA, un framework di aggregazione online guidato da LLM che accelera l'elaborazione semantica dei testi non strutturati trasformandoli in flussi di dati strutturati e applicando un campionamento stratificato semantico per fornire risultati progressivi con un'alta precisione e tempi di esecuzione significativamente ridotti rispetto all'elaborazione batch completa.

Chao Hui, Weizheng Lu, Yanjie Gao, Lingfeng Xiong, Yunhai Wang, Yueguo ChenTue, 10 Ma💻 cs

Direct Access for Conjunctive Queries with Negations

Questo lavoro generalizza i risultati sulla tracciabilità dell'accesso diretto alle risposte delle query congiuntive al caso di query con negazioni, dimostrando che tale operazione è fattibile in tempo polilogaritmico dopo una pre-elaborazione polinomiale per una vasta classe di query, inclusi i casi β\beta-aciclici e quelli con larghezza di nido limitata, utilizzando una tecnica basata su circuiti relazionali.

Florent Capelli, Nofar Carmeli, Oliver Irwin, Sylvain SalvatiThu, 12 Ma💻 cs

K-Join: Combining Vertex Covers for Parallel Joins

Il paper presenta K-Join, un nuovo algoritmo semplice per l'elaborazione di join in ambienti di calcolo parallelo massivo che, combinando partizionamento dei dati e il primitivo HyperCube attraverso una scelta innovativa delle quote basata su coperture dei vertici, raggiunge un carico di lavoro ottimale pari a n/p1/κn/p^{1/\kappa}, dove κ\kappa è una nuova misura teorica chiamata "reduced quasi vertex-cover".

Simon Frisk, Austen Fan, Paraschos KoutrisThu, 12 Ma💻 cs