LLM-FK: Multi-Agent LLM Reasoning for Foreign Key Detection in Large-Scale Complex Databases

L'article présente LLM-FK, un cadre multi-agents entièrement automatisé qui surpasse les méthodes existantes pour détecter les clés étrangères manquantes dans de grandes bases de données complexes en résolvant les problèmes d'explosion combinatoire, d'ambiguïté contextuelle et d'incohérence globale grâce à une coordination spécialisée de quatre agents.

Zijian Tang, Ying Zhang, Sibo Cai, Ruoxuan WangTue, 10 Ma💻 cs

Enhancing OLAP Resilience at LinkedIn

Ce papier présente un cadre de résilience holistique pour Apache Pinot chez LinkedIn, intégrant l'isolation des charges de travail, le rééquilibrage sans impact, la conscience des zones de maintenance et la sélection adaptative de serveurs pour garantir une faible latence et une haute disponibilité à l'échelle.

Praveen Chaganlal, Jia Guo, Vivek Vaidyanathan, Dino Occhialini, Sonam Mandal, Subbu Subramaniam, Siddharth Teotia, Tianqi Li, Xiaxuan Gao, Florence ZhangTue, 10 Ma💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

Le papier présente Dial, un système NL2SQL ancré dans des connaissances qui améliore la génération de requêtes pour des dialectes SQL hétérogènes grâce à une planification logique adaptée, une base de connaissances hiérarchique et une boucle de débogage exécutée, surpassant ainsi les méthodes existantes sur un nouveau benchmark multi-dialectes.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan WuTue, 10 Ma🤖 cs.LG

GP-Tree: An in-memory spatial index combining adaptive grid cells with a prefix tree for efficient spatial querying

Ce papier présente le GP-Tree, un index spatial en mémoire de nouvelle génération qui combine une grille adaptative et un arbre de préfixes pour remplacer les approximations grossières par des cellules fines, offrant ainsi des performances de requête nettement supérieures aux index traditionnels.

Xiangyang Yang, Xuefeng Guan, Lanxue Dang, Yi Xie, Qingyang Xu, Huayi Wu, Jiayao WangTue, 10 Ma💻 cs

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

Ce papier présente Rel-MOSS, une nouvelle méthode d'apprentissage profond relationnel qui résout le problème du déséquilibre des classes dans les bases de données relationnelles grâce à un contrôleur de porte relationnel et un synthétiseur de minorité guidé par les relations, surpassant ainsi les méthodes actuelles sur plusieurs jeux de données.

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi ZhangTue, 10 Ma🤖 cs.LG

Decomposition-Driven Multi-Table Retrieval and Reasoning for Numerical Question Answering

Ce papier présente DMRAL, un cadre innovant pour la réponse aux questions numériques sur de vastes collections de tables, qui surpasse les méthodes existantes en combinant la construction d'un graphe de relations entre tables, une décomposition de questions alignée et une récupération de tables ciblée, ainsi qu'un raisonnement guidé par sous-questions, permettant d'améliorer significativement la précision de la récupération et de la réponse.

Feng Luo, Hai Lan, Hui Luo, Zhifeng Bao, Xiaoli Wang, J. Shane Culpepper, Shazia SadiqTue, 10 Ma💻 cs

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

Cet article présente STemDist, une méthode innovante de distillation de données conçue spécifiquement pour les séries temporelles spatio-temporelles, qui comprime simultanément les dimensions spatiales et temporelles au niveau des clusters pour accélérer l'entraînement des modèles, réduire l'usage mémoire et améliorer la précision des prévisions par rapport aux méthodes existantes.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung ShinThu, 12 Ma🤖 cs.LG