Modeling Concurrency Control as a Learnable Function

Il paper presenta NeurCC, un nuovo algoritmo di controllo della concorrenza basato sull'apprendimento automatico che, superando i limiti degli approcci tradizionali, ottimizza rapidamente le prestazioni su carichi di lavoro dinamici e diversificati tramite una funzione appresa e implementata come tabella di ricerca all'interno del database.

Hexiang Pan, Shaofeng Cai, Tien Tuan Anh Dinh, Yuncheng Wu, Yeow Meng Chee, Gang Chen, Beng Chin OoiWed, 11 Ma💻 cs

DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering

Il paper presenta DataFactory, un framework collaborativo multi-agente che supera le limitazioni dei modelli linguistici esistenti nelle risposte a domande su tabelle, combinando un coordinatore ReAct, team specializzati per database e grafi della conoscenza, e strategie di ingegneria del contesto per ottenere significativi miglioramenti di accuratezza e riduzione delle allucinazioni su diversi benchmark.

Tong Wang, Chi Jin, Yongkang Chen, Huan Deng, Xiaohui Kuang, Gang ZhaoWed, 11 Ma🤖 cs.AI

Evaluating the Practical Effectiveness of LLM-Driven Index Tuning with Microsoft Database Tuning Advisor

Questo studio valuta l'efficacia pratica del tuning degli indici guidato dai LLM confrontandolo con il Database Tuning Advisor (DTA) di Microsoft, rivelando che, sebbene i LLM possano identificare configurazioni superiori in alcuni casi grazie a intuizioni umane, la loro adozione in produzione è attualmente limitata da una significativa variabilità delle prestazioni e da costi di validazione elevati.

Xiaoying Wang, Wentao Wu, Vivek Narasayya, Surajit ChaudhuriWed, 11 Ma💻 cs

Epistemic Closure: Autonomous Mechanism Completion for Physically Consistent Simulation

Questo lavoro presenta un agente generativo neuro-simbolico che supera le allucinazioni fisiche dei modelli linguistici tradizionali validando autonomamente le assunzioni teoriche e completando i meccanismi fisici mancanti, come dimostrato nella simulazione coerente della pressurizzazione termica in arenaria a bassa permeabilità.

Yue Wua, Tianhao Su, Rui Hu, Mingchuan Zhao, Shunbo Hu, Deng Pan, Jizhong HuangWed, 11 Ma💻 cs

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

Il paper introduce MMTU, un nuovo benchmark su larga scala con oltre 28.000 domande su 25 compiti reali, progettato per valutare in modo completo le capacità di comprensione, ragionamento e manipolazione delle tabelle da parte dei modelli linguistici, rivelando che anche i modelli più avanzati attuali hanno ancora margini significativi di miglioramento in questo dominio.

Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. JagadishTue, 10 Ma🤖 cs.LG

Towards Practical Benchmarking of Data Cleaning Techniques: On Generating Authentic Errors via Large Language Models

Il paper introduce TableEG, un framework basato su modelli linguistici di grandi dimensioni e strategie di fine-tuning che genera errori sintetici autentici nei dati tabellari, colmando il divario tra dati reali e artificiali per fornire un benchmark robusto e affidabile per la valutazione delle tecniche di rilevamento e correzione degli errori.

Xinyuan Liu, Jiahui Chen, Bocheng Hu, Yu Sun, Xinyang Chen, Shaoxu Song, Yongxin TongTue, 10 Ma🤖 cs.LG

SDFed: Bridging Local Global Discrepancy via Subspace Refinement and Divergence Control in Federated Prompt Learning

Il paper propone SDFed, un framework di apprendimento federato eterogeneo che risolve le discrepanze locali-globali nell'adattamento dei modelli visione-linguaggio consentendo prompt locali a lunghezza variabile e introducendo tecniche di raffinamento del sottospazio e controllo della divergenza per migliorare le prestazioni in ambienti con dati e risorse disomogenei.

Yicheng Di, Wei Yuan, Tieke He, Yuan Liu, Hongzhi YinTue, 10 Ma🤖 cs.LG

The Fifth Graph Normal Form (5GNF): A Trait-Based Framework for Metadata Normalization in Property Graphs

Questo articolo introduce la Quinta Forma Normale dei Grafi (5GNF), un framework basato su "trait" che normalizza i metadati nei grafi di proprietà trasformando gli attributi ricorrenti in nodi condivisi per ridurre la ridondanza, migliorare la coerenza semantica e semplificare le query, come dimostrato dall'implementazione e valutazione su Neo4j con il dataset Northwind.

Yahya Sa'd, Vojtech Merunka, Renzo AnglesTue, 10 Ma💻 cs