LLM-FK: Multi-Agent LLM Reasoning for Foreign Key Detection in Large-Scale Complex Databases

O artigo apresenta o LLM-FK, um framework multi-agente totalmente automatizado que supera as limitações dos métodos heurísticos e de soluções LLM ingênuas para detecção de chaves estrangeiras em grandes bancos de dados complexos, alcançando alta precisão e escalabilidade através de uma arquitetura coordenada de quatro agentes especializados.

Zijian Tang, Ying Zhang, Sibo Cai, Ruoxuan WangTue, 10 Ma💻 cs

Tursio for Credit Unions: Powering Structured Data Search with Automated Context Graph

O artigo apresenta o Tursio, uma plataforma de busca de banco de dados segura e local que permite a usuários de cooperativas de crédito consultarem sistemas complexos usando linguagem natural, inferindo automaticamente um grafo de conhecimento semântico e gerando planos de consulta precisos e conformes por meio da integração de Modelos de Linguagem de Grande Escala (LLMs).

Shivani Tripathi, Ravi Shetye, Shi Qiao, Alekh JindalTue, 10 Ma💻 cs

Enhancing OLAP Resilience at LinkedIn

Este artigo descreve um conjunto abrangente de mecanismos de resiliência desenvolvidos para o Apache Pinot no LinkedIn, incluindo isolamento de carga de consultas, reequilíbrio sem impacto e seleção adaptativa de servidores, que garantem baixa latência e alta disponibilidade em sistemas OLAP de grande escala sob falhas e picos de demanda.

Praveen Chaganlal, Jia Guo, Vivek Vaidyanathan, Dino Occhialini, Sonam Mandal, Subbu Subramaniam, Siddharth Teotia, Tianqi Li, Xiaxuan Gao, Florence ZhangTue, 10 Ma💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

O artigo apresenta o Dial, um sistema de NL2SQL baseado em conhecimento que supera as limitações dos métodos existentes ao gerar consultas SQL semanticamente corretas e executáveis em diversos dialetos de banco de dados, utilizando planejamento lógico consciente de dialeto, uma base de conhecimento hierárquica e um ciclo de depuração orientado à execução.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan WuTue, 10 Ma🤖 cs.LG

GP-Tree: An in-memory spatial index combining adaptive grid cells with a prefix tree for efficient spatial querying

O artigo apresenta o GP-Tree, um índice espacial em memória que combina células de grade adaptativas com uma árvore de prefixos para superar as limitações dos índices tradicionais baseados em retângulos delimitadores, oferecendo uma filtragem mais precisa e melhorando significativamente a eficiência de consultas espaciais em grandes conjuntos de dados.

Xiangyang Yang, Xuefeng Guan, Lanxue Dang, Yi Xie, Qingyang Xu, Huayi Wu, Jiayao WangTue, 10 Ma💻 cs

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

O artigo apresenta o Rel-MOSS, um novo método de aprendizado profundo relacional que utiliza um controlador de portas por tipo de relação e um sintetizador guiado por relações para realizar sobreamostragem de entidades minoritárias, resolvendo eficazmente o problema de desequilíbrio de classes em bancos de dados relacionais e superando os métodos atuais em precisão balanceada e média geométrica.

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi ZhangTue, 10 Ma🤖 cs.LG

Decomposition-Driven Multi-Table Retrieval and Reasoning for Numerical Question Answering

O artigo apresenta o DMRAL, um framework inovador para responder a perguntas numéricas em grandes coleções de tabelas que supera as limitações dos métodos existentes ao utilizar decomposição de perguntas, um grafo de relacionamentos entre tabelas e raciocínio guiado para melhorar significativamente a recuperação de dados relevantes e a precisão das respostas.

Feng Luo, Hai Lan, Hui Luo, Zhifeng Bao, Xiaoli Wang, J. Shane Culpepper, Shazia SadiqTue, 10 Ma💻 cs

LLM-Driven Online Aggregation for Unstructured Text Analytics

O artigo apresenta o OLLA, um framework de agregação online impulsionado por Grandes Modelos de Linguagem (LLMs) que acelera o processamento de texto não estruturado em consultas relacionais através de amostragem estratificada semântica e agregação incremental, alcançando resultados precisos com uma fração mínima do tempo necessário para processar dados completos.

Chao Hui, Weizheng Lu, Yanjie Gao, Lingfeng Xiong, Yunhai Wang, Yueguo ChenTue, 10 Ma💻 cs

Direct Access for Conjunctive Queries with Negations

Este artigo generaliza os resultados de acessibilidade direta para consultas conjuntivas positivas, demonstrando que consultas conjuntivas assinadas (que podem conter átomos negativos) também admitem acesso direto eficiente após pré-processamento polinomial, utilizando circuitos relacionais para caracterizar classes tratáveis como as consultas negativas β\beta-acíclicas e de largura de conjunto de aninhamento limitada.

Florent Capelli, Nofar Carmeli, Oliver Irwin, Sylvain SalvatiThu, 12 Ma💻 cs