Sketch-Oriented Databases

この論文は、有限極限スケッチを用いてデータベースのパラダイムを形式化する「スケッチ指向データベース」という枠組みを提案し、グラフ特徴の統一的な表現や経路推論、そしてモジュール化とスケーラビリティを可能にする「スタッタリングスケッチ」の導入を通じて、データベース理論の一般化と拡張を示しています。

Dominique Duval, Rachid EchahedTue, 10 Ma💻 cs

LLM-FK: Multi-Agent LLM Reasoning for Foreign Key Detection in Large-Scale Complex Databases

この論文は、大規模で複雑なデータベースにおける外部キーの検出を目的とした、4 つの専門エージェントが協調して探索空間の爆発や文脈の曖昧さ、局所予測の矛盾といった課題を解決する初の完全自動化マルチエージェントフレームワーク「LLM-FK」を提案し、既存手法を大幅に上回る精度とスケーラビリティを実証したものです。

Zijian Tang, Ying Zhang, Sibo Cai, Ruoxuan WangTue, 10 Ma💻 cs

Tursio for Credit Unions: Powering Structured Data Search with Automated Context Graph

この論文は、複雑なスキーマやレガシーシステム、厳格なデータガバナンスに直面する信用組合向けに、自然言語での企業データベース検索を可能にする安全なオンプレミス型プラットフォーム「Tursio」を提案し、大規模言語モデルを活用して意味知識グラフを自動推論し、意図を文脈化して正確かつコンプライアンスに準拠したクエリ計画を生成する仕組みを説明しています。

Shivani Tripathi, Ravi Shetye, Shi Qiao, Alekh JindalTue, 10 Ma💻 cs

Enhancing OLAP Resilience at LinkedIn

この論文は、LinkedIn における Apache Pinot の実運用で開発され、リソース分離、影響の少ないリバランス、障害耐性のある配置、適応型サーバー選択などのメカニズムを通じて、大規模 OLAP システムの堅牢性と SLA 遵守を達成する包括的なフレームワークを提案しています。

Praveen Chaganlal, Jia Guo, Vivek Vaidyanathan, Dino Occhialini, Sonam Mandal, Subbu Subramaniam, Siddharth Teotia, Tianqi Li, Xiaxuan Gao, Florence ZhangTue, 10 Ma💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

本論文は、異なる SQL 方言を持つ多様なデータベースシステムに対応し、構文と意味の両面で正確なクエリ生成を実現するために、方言認識論理クエリ計画モジュール、階層的意図認識知識ベース、および実行駆動型デバッグループを導入した「Dial」という知識基盤型 NL2SQL 枠組みを提案し、新しいベンチマーク DS-NL2SQL による実験で最先端手法を上回る性能を示したものである。

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan WuTue, 10 Ma🤖 cs.LG

GP-Tree: An in-memory spatial index combining adaptive grid cells with a prefix tree for efficient spatial querying

この論文は、複雑な空間オブジェクトの効率的な検索を実現するため、粗い最小境界矩形に代わって微細なグリッドセルをプレフィックス木構造に組み合わせた新しいインメモリ空間インデックス「GP-Tree」を提案し、実データによる実験で従来の手法を最大で桁違いに凌駕する性能向上を実証しています。

Xiangyang Yang, Xuefeng Guan, Lanxue Dang, Yi Xie, Qingyang Xu, Huayi Wu, Jiayao WangTue, 10 Ma💻 cs

Structured Gossip: A Partition-Resilient DNS for Internet-Scale Dynamic Networks

この論文は、DHT のフィンガーテーブルを活用したパッシブな安定化メカニズムと版数ベクトルを導入することで、グローバルな協調なしに大規模なモバイルアドホックネットワークにおけるネットワーク分断に耐性を持ち、メッセージ複雑度を削減しながら最終的な一貫性を保証する「構造化されたゴシップ DNS」を提案しています。

Priyanka Sinha, Dilys ThomasTue, 10 Ma💻 cs

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

本論文は、リレーショナルデータベースにおける不均衡データ問題に初めて着目し、関係性ごとのゲート制御と関係性ガイドの少数派合成を用いて不均衡なエンティティ分類を改善する深層学習手法「Rel-MOSS」を提案し、既存手法を上回る性能を実証したものである。

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi ZhangTue, 10 Ma🤖 cs.LG

Decomposition-Driven Multi-Table Retrieval and Reasoning for Numerical Question Answering

本論文は、大規模な表コレクションにおける数値多表質問応答の課題を解決するため、表関係グラフの構築、質問分解とカバレッジを考慮した表検索、および部分質問に基づく推論プログラム生成を組み合わせた「DMRAL」フレームワークを提案し、既存手法を大幅に上回る性能を実証したものである。

Feng Luo, Hai Lan, Hui Luo, Zhifeng Bao, Xiaoli Wang, J. Shane Culpepper, Shazia SadiqTue, 10 Ma💻 cs

Samyama: A Unified Graph-Vector Database with In-Database Optimization, Agentic Enrichment, and Hardware Acceleration

本論文は、Rust で実装され、グラフ・ベクトル・最適化ワークロードを単一のエンジンに統合し、インデータベース最適化やエージェントによる拡張、ハードウェアアクセラレーションを実現する高性能データベース「Samyama」を提案し、汎用ハードウェア上でも競合する性能を発揮することを示しています。

Madhulatha Mandarapu, Sandeep KunkunuruTue, 10 Ma💻 cs

PRIME: Efficient Algorithm for Token Graph Routing Problem

本論文は、暗号資産取引所における非線形なエッジ重みを持つ大規模グラフ上の経路探索問題(TGRP)に対して、剪定グラフ探索と適応符号勾配法(ASGM)を用いた二段階アルゴリズム「PRIME」を提案し、実世界のデータにおいて既存の Uniswap ルーティングアルゴリズムを上回る実行価格と計算効率を実現したことを示しています。

Haotian Xu, Yuqing Zhu, Yuming Huang, Jing TangTue, 10 Ma💻 cs

LLM-Driven Online Aggregation for Unstructured Text Analytics

LLM を用いた非構造化テキスト分析のリアルタイム応答性を向上させるため、全データ処理を待たずに漸進的な結果を提供するオンライン集約フレームワーク「OLLA」と、収束を加速させる意味的層化サンプリング手法を提案し、実験により高精度かつ大幅な高速化を実現したことを示す論文です。

Chao Hui, Weizheng Lu, Yanjie Gao, Lingfeng Xiong, Yunhai Wang, Yueguo ChenTue, 10 Ma💻 cs

Direct Access for Conjunctive Queries with Negations

この論文は、回路を用いた手法により、負の原子を含む結合クエリ(符号付き結合クエリ)に対する直接アクセスの計算量理論を一般化し、正の結合クエリにおける既知の結果を回復するとともに、β\beta-非循環や有界ネスセット幅を持つ負の結合クエリなど、新たな tractable なクラスを特定するものです。

Florent Capelli, Nofar Carmeli, Oliver Irwin, Sylvain SalvatiThu, 12 Ma💻 cs

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

この論文は、時空間データセットの圧縮において時間・空間の両次元をバランスよく圧縮し、クラスタレベルとサブセットレベルの手法を組み合わせることで、従来の手法よりも高速かつメモリ効率よく、かつ予測精度を向上させた新しい時空間データセット蒸留手法「STemDist」を提案するものである。

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung ShinThu, 12 Ma🤖 cs.LG