LLM-FK: Multi-Agent LLM Reasoning for Foreign Key Detection in Large-Scale Complex Databases

Die Arbeit stellt LLM-FK vor, ein vollständig automatisiertes Multi-Agenten-Framework, das mithilfe spezialisierter Agenten die Erkennung fehlender Fremdschlüssel in großen, komplexen Datenbanken durch effiziente Suchraumreduktion und konsistente mehrstufige Schlussfolgerung revolutioniert und dabei signifikant höhere Genauigkeit als bestehende Methoden erreicht.

Zijian Tang, Ying Zhang, Sibo Cai, Ruoxuan WangTue, 10 Ma💻 cs

Enhancing OLAP Resilience at LinkedIn

Die Arbeit stellt einen umfassenden Resilienzrahmen für Apache Pinot bei LinkedIn vor, der durch Mechanismen wie Query Workload Isolation, impactfreie Rebalancing-Prozesse, Wartungszone-Bewusstsein und adaptive Serverauswahl subsekundäre Latenzen und hohe Verfügbarkeit auch bei Ausfällen und Lastspitzen gewährleistet.

Praveen Chaganlal, Jia Guo, Vivek Vaidyanathan, Dino Occhialini, Sonam Mandal, Subbu Subramaniam, Siddharth Teotia, Tianqi Li, Xiaxuan Gao, Florence ZhangTue, 10 Ma💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

Die Arbeit stellt Dial vor, ein wissensbasiertes Framework für dialektspezifische NL2SQL-Übersetzungen, das durch eine dialektsensible logische Abfrageplanung, eine hierarchische Wissensdatenbank und einen ausführungsbasierten Debugging-Prozess die Genauigkeit und Abdeckung von Datenbankdialekten im Vergleich zu bestehenden Methoden signifikant verbessert.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan WuTue, 10 Ma🤖 cs.LG

GP-Tree: An in-memory spatial index combining adaptive grid cells with a prefix tree for efficient spatial querying

Die Arbeit stellt GP-Tree vor, einen neuen in-Memory-Raumindex, der feinkörnige Gitterzellen in einer Präfixbaumstruktur organisiert und durch Optimierungsstrategien wie das Beschneiden von Bäumen die Abfrageeffizienz für komplexe räumliche Daten im Vergleich zu traditionellen Indizes um eine Größenordnung verbessert.

Xiangyang Yang, Xuefeng Guan, Lanxue Dang, Yi Xie, Qingyang Xu, Huayi Wu, Jiayao WangTue, 10 Ma💻 cs

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

Die Arbeit stellt Rel-MOSS vor, einen neuartigen Graph-Neural-Network-Ansatz, der durch relationsspezifische Gating-Mechanismen und eine geführte Überabtastung das Problem des Klassenungleichgewichts bei der Entitätsklassifizierung in relationalen Datenbanken adressiert und damit die Leistung bestehender Methoden signifikant verbessert.

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi ZhangTue, 10 Ma🤖 cs.LG

Decomposition-Driven Multi-Table Retrieval and Reasoning for Numerical Question Answering

Die Arbeit stellt DMRAL vor, ein dekompositionsgetriebenes Framework zur Beantwortung numerischer Fragen über große Tabellenkollektionen, das durch die Konstruktion eines Tabellengraphen, eine abgestimmte Fragezerlegung mit abdeckungsbewusstem Abruf sowie einen subfragegesteuerten Reasoner die Grenzen bestehender Methoden in Bezug auf komplexe Tabellenbeziehungen, Skalierbarkeit und Antwortgenauigkeit überwindet.

Feng Luo, Hai Lan, Hui Luo, Zhifeng Bao, Xiaoli Wang, J. Shane Culpepper, Shazia SadiqTue, 10 Ma💻 cs

Samyama: A Unified Graph-Vector Database with In-Database Optimization, Agentic Enrichment, and Hardware Acceleration

Die Arbeit stellt Samyama vor, eine in Rust entwickelte, hochperformante Graph-Vector-Datenbank, die Graphenverarbeitung, Vektorsuche, analytische Abfragen und Metaheuristik-Optimierung in einer einzigen Engine mit In-Database-Optimierung, agentischer Anreicherung und Hardware-Beschleunigung vereint, um komplexe Datenpipelines zu eliminieren und gleichzeitig hohe Leistung auf Standardhardware zu gewährleisten.

Madhulatha Mandarapu, Sandeep KunkunuruTue, 10 Ma💻 cs

Direct Access for Conjunctive Queries with Negations

Diese Arbeit verallgemeinert die Ergebnisse zur direkten Zugriffbarkeit von konjunktiven Abfragen auf den Fall negierter Atome, indem sie eine auf Schaltkreisen basierende Technik entwickelt, die für eine große Klasse von Abfragen – einschließlich β\beta-azyklischer und solcher mit beschränkter Nest-Set-Breite – eine effiziente direkte Zugriffsmöglichkeit nach polynomialer Vorverarbeitung ermöglicht.

Florent Capelli, Nofar Carmeli, Oliver Irwin, Sylvain SalvatiThu, 12 Ma💻 cs

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

Die Arbeit stellt STemDist vor, die erste Dataset-Distillationsmethode für die spatio-temporale Vorhersage, die durch eine ausgewogene zweidimensionale Kompression von Raum und Zeit sowie eine Cluster-basierte Verfeinerung die Trainingszeit und den Speicherbedarf signifikant reduziert und gleichzeitig die Vorhersagegenauigkeit verbessert.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung ShinThu, 12 Ma🤖 cs.LG