Enhancing OLAP Resilience at LinkedIn

本文介绍了 LinkedIn 为 Apache Pinot 开发的一套综合弹性机制,包括查询工作负载隔离、无影响重平衡、维护区感知和自适应服务器选择,旨在确保大规模实时 OLAP 系统在故障、负载激增和集群变更等场景下仍能维持严格的 SLA 和高可用性。

Praveen Chaganlal, Jia Guo, Vivek Vaidyanathan, Dino Occhialini, Sonam Mandal, Subbu Subramaniam, Siddharth Teotia, Tianqi Li, Xiaxuan Gao, Florence ZhangTue, 10 Ma💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

本文提出了 Dial,一种基于知识的地域特定 NL2SQL 系统,通过引入方言感知逻辑查询规划、分层意图知识基以及执行驱动的调试验证循环,有效解决了现有方法在处理异构数据库方言时语义正确性与可执行性不足的问题,并在新构建的 DS-NL2SQL 基准测试中显著提升了翻译准确率与方言特性覆盖率。

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan WuTue, 10 Ma🤖 cs.LG

GP-Tree: An in-memory spatial index combining adaptive grid cells with a prefix tree for efficient spatial querying

本文提出了一种名为 GP-Tree 的新型内存空间索引,它通过将空间对象的细粒度网格单元编码组织为前缀树结构,并辅以剪枝等优化策略,有效克服了传统索引在处理复杂空间对象时的精度与性能瓶颈,在多种空间查询任务中实现了比传统索引高出一个数量级的效率提升。

Xiangyang Yang, Xuefeng Guan, Lanxue Dang, Yi Xie, Qingyang Xu, Huayi Wu, Jiayao WangTue, 10 Ma💻 cs

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

本文针对关系数据库中实体分类任务存在的类别不平衡问题,提出了关系中心的小样本合成过采样图神经网络模型 Rel-MOSS,通过设计关系门控控制器和关系引导合成器来增强少数类信息表达与一致性,显著提升了模型在平衡准确率和几何平均数上的性能。

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi ZhangTue, 10 Ma🤖 cs.LG

Decomposition-Driven Multi-Table Retrieval and Reasoning for Numerical Question Answering

本文提出了 DMRAL 框架,通过构建表关系图、设计表对齐问题分解器与覆盖感知检索器以及子问题引导推理器,有效解决了大规模表格集合中数值多表问答面临的复杂关系支持不足、检索低效及答案生成不准确等挑战,显著提升了检索与回答准确率。

Feng Luo, Hai Lan, Hui Luo, Zhifeng Bao, Xiaoli Wang, J. Shane Culpepper, Shazia SadiqTue, 10 Ma💻 cs

Samyama: A Unified Graph-Vector Database with In-Database Optimization, Agentic Enrichment, and Hardware Acceleration

本文介绍了 Samyama,一个用 Rust 构建的高性能统一图 - 向量数据库,它通过整合内建优化求解器、代理增强功能及硬件加速技术,在单一引擎中实现了图分析、向量检索与元启发式优化的无缝融合,并在消费级硬件上展现出卓越的吞吐量和低延迟性能。

Madhulatha Mandarapu, Sandeep KunkunuruTue, 10 Ma💻 cs