cs.DB 件の論文 | Gist.Science

Modeling Concurrency Control as a Learnable Function

本論文は、ベイズ最適化とグラフ削減探索アルゴリズムを用いて既存の並行制御アルゴリズムの設計選択を学習し、効率的なデータベース内ルックアップテーブルとして実装された新しい学習型並行制御アルゴリズム「NeurCC」を提案し、多様なワークロードにおいて従来の最先端手法を上回る高いトランザクションスループットと最適化速度を実現することを示しています。

Hexiang Pan, Shaofeng Cai, Tien Tuan Anh Dinh, Yuncheng Wu, Yeow Meng Chee, Gang Chen, Beng Chin OoiWed, 11 Ma💻 cs

OptBench: An Interactive Workbench for AI/ML-SQL Co-Optimization[Extended Demonstration Proposal]

この論文は、SQL と AI/ML を組み合わせたハイブリッドクエリ向けの最適化手法を、DuckDB ベースの統合バックエンドとインタラクティブな Web インターフェースを通じて公平かつ透明性高く構築・比較・可視化することを可能にする「OptBench」という対話型ワークベンチを提案するものである。

Jaykumar Tandel, Douglas Oscarson, Jia ZouWed, 11 Ma💻 cs

Automated Tensor-Relational Decomposition for Large-Scale Sparse Tensor Computation

この論文は、大規模な疎テンソル計算において、計算集約的な部分を効率的な数値カーネルで実行し、疎性をリレーショナルシステムで管理できるよう、古典的なアインシュタインの総和記法をテンソル関係計算向けに拡張した「EinSum」を提案し、その自動書き換え手法を研究するものである。

Yuxin Tang, Zhiyuan Xin, Zhimin Ding, Xinyu Yao, Daniel Bourgeois, Tirthak Patel, Chris JermaineWed, 11 Ma🤖 cs.AI

Nezha: A Key-Value Separated Distributed Store with Optimized Raft Integration

本論文は、合意プロトコルとストレージエンジン間の重複する永続化操作による I/O オーバーヘッドを解消するため、キー・バリュー分離と Raft を最適化して統合し、Put/Get/Scan 操作で大幅なスループット向上を実現した分散キーバリューストア「Nezha」を提案するものである。

Yangyang Wang, Yucong Dong, Ziqian Cheng, Zichen XuWed, 11 Ma💻 cs

DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering

この論文は、文脈長の制約や幻覚、単一エージェントの限界といった既存の表質問応答（TableQA）の課題を克服するため、データリーダー、データベースチーム、知識グラフチームによる協調と自動知識変換を導入したマルチエージェントフレームワーク「DataFactory」を提案し、複数のベンチマークで大幅な精度向上を実証したものである。

Tong Wang, Chi Jin, Yongkang Chen, Huan Deng, Xiaohui Kuang, Gang ZhaoWed, 11 Ma🤖 cs.AI

Evaluating the Practical Effectiveness of LLM-Driven Index Tuning with Microsoft Database Tuning Advisor

本論文は、大規模言語モデル（LLM）を用いたインデックス調整が、Microsoft のデータベース調整アシスタント（DTA）よりも優れた実行時間を達成する可能性を示す一方で、その性能のばらつきや実運用への統合の難しさから、現状では補完的な技術として位置づけられるべきであることを、ベンチマークおよび実企業ワークロードを用いた評価を通じて明らかにしています。

Xiaoying Wang, Wentao Wu, Vivek Narasayya, Surajit ChaudhuriWed, 11 Ma💻 cs

The Virtuous Cycle: AI-Powered Vector Search and Vector Search-Augmented AI

本論文は、AI によるベクトル検索の最適化と、ベクトル検索による AI（特に RAG）の能力拡張という相互強化関係（「好循環」）を体系的に解説し、ICDE 2026 において発表されたチュートリアルである。

Jiuqi Wei, Quanqing Xu, Chuanhui YangWed, 11 Ma💻 cs

GeoBenchr: An Application-Centric Benchmarking Suite for Spatiotemporal Database Platforms

本論文は、サイクリングや航空、海事追跡などの実世界のユースケースを反映し、スケーラビリティや設定の影響、プラットフォーム間の性能比較を含む包括的な評価を可能にする、オープンソースのアプリケーション中心時空間データベースベンチマークスイート「GeoBenchr」を提案するものである。

Tim C. Rese, Nils Japke, Diana Baumann, Natalie Carl, David BermbachWed, 11 Ma💻 cs

No Cliques Allowed: The Next Step Towards BDD/FC Conjecture

本論文は、有界導出深さの存在則集合が有限制御性を満たすという未解決の予想に対し、その反例となり得る普遍モデルがループクエリを導出しない限り任意に大きなトーナメント（有向完全グラフ）を含むことができないことを示すことで、予想の肯定的解決に向けた重要な一歩を踏み出したものである。

Lucas Larroque, Piotr Ostropolski-Nalewaja, Michaël ThomazoWed, 11 Ma💻 cs

Local Stability of Rankings

この論文は、ランキングアルゴリズムのデータへの微小な変化に対する感度を評価する「局所安定性」という新たな指標を提案し、その計算の困難さを克服するための近似アルゴリズムと密な領域の検出手法を開発して、大規模な実験によりその有効性を検証したものである。

Felix S. Campbell, Yuval MoskovitchWed, 11 Ma💻 cs

Epistemic Closure: Autonomous Mechanism Completion for Physically Consistent Simulation

この論文は、LLM の物理的仮定を見落とすという課題を解決し、数値シミュレーションにおいて支配方程式の欠落メカニズムを自律的に推論・補完して物理的に整合的な結果を導き出す「認識的閉鎖」を実現するニューロ記号的生成エージェントを提案するものである。

Yue Wua, Tianhao Su, Rui Hu, Mingchuan Zhao, Shunbo Hu, Deng Pan, Jizhong HuangWed, 11 Ma💻 cs

Expressive Power of Property Graph Constraint Languages

この論文は、GQL 標準の改訂を背景に、PG-Keys 言語を既存の制約言語（GFD や GGD）と比較・評価するための統一枠組みを提案し、構造的な差異に基づいた完全かつ厳密な表現力の階層を確立することで、PG-Keys の表現能力が厳密に優越する条件を明らかにするものです。

Stefania Dumbrava, Nadime Francis, Victor Marsault, Steven SaillyWed, 11 Ma💻 cs

How to Write to SSDs

本論文は、データベースシステムが SSD の性能を最大限に引き出し寿命を延ばすために、B-tree ベースの LeanStore を再設計してアウト・オブ・プレイス書き込みを最適化し、トランザクションごとのフラッシュ書き込みを大幅に削減しながらスループットを向上させる手法を提案・評価したものである。

Bohyun Lee, Tobias Ziegler, Viktor LeisWed, 11 Ma💻 cs

WikiDBGraph: A Data Management Benchmark Suite for Collaborative Learning over Database Silos

既存の協調学習ベンチマークが現実のデータサイロの複雑さ（非整合性や結合不可能性など）を無視しているという課題に対し、10 万の現実世界データベースと 1700 万の関連性から構成される大規模データセット「WikiDBGraph」を構築し、協調学習システムの実用的な評価と改善の方向性を提示する。

Zhaomin Wu, Ziyang Wang, Bingsheng HeTue, 10 Ma🤖 cs.LG

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

本論文は、表形式データの理解・推論・操作に関する専門家のレベルを包括的に評価するため、25 の実世界タスクと 2 万 8 千以上の質問からなる大規模ベンチマーク「MMTU」を提案し、最先端のモデルでも高い性能が求められていることを示しています。

Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. JagadishTue, 10 Ma🤖 cs.LG

Towards Practical Benchmarking of Data Cleaning Techniques: On Generating Authentic Errors via Large Language Models

本論文は、大規模言語モデルを用いて表データに実在の誤りを生成するフレームワーク「TableEG」を提案し、これにより合成データと実世界データの誤り分布のギャップを埋め、データクレンジング手法の信頼性あるベンチマーク確立を実現したことを示しています。

Xinyuan Liu, Jiahui Chen, Bocheng Hu, Yu Sun, Xinyang Chen, Shaoxu Song, Yongxin TongTue, 10 Ma🤖 cs.LG

SDFed: Bridging Local Global Discrepancy via Subspace Refinement and Divergence Control in Federated Prompt Learning

本論文は、データ分布やリソースの多様性に対応し、ローカルとグローバルな知識の矛盾を解消するため、固定長のグローバルプロンプトと可変長のローカルプロンプトを組み合わせ、部分空間微調整と発散制御を導入した新しいフェデレーティドプロンプト学習フレームワーク「SDFed」を提案し、その有効性を示すものである。

Yicheng Di, Wei Yuan, Tieke He, Yuan Liu, Hongzhi YinTue, 10 Ma🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

本論文は、現代の AI アプリケーションが求める高効率な検索、高速インデックス作成、低メモリ使用量などの 6 つの要件をすべて満たすため、投影技術とグラフインデックスを統合した新しい近似最近傍検索フレームワーク「PAG」を提案し、HNSW より最大 5 倍高速な検索性能を実現することを示しています。

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan XiaoTue, 10 Ma🤖 cs.LG

The Fifth Graph Normal Form (5GNF): A Trait-Based Framework for Metadata Normalization in Property Graphs

この論文は、プロパティグラフにおけるメタデータの冗長性と意味的不整合を解消するため、繰り返し現れるメタデータを標準化された「特性ノード」として抽出・正規化する「第 5 正規化形（5GNF）」という新たな枠組みを提案し、その有効性を北風データセットを用いた実証実験で示しています。

Yahya Sa'd, Vojtech Merunka, Renzo AnglesTue, 10 Ma💻 cs

Not All Neighbors Matter: Understanding the Impact of Graph Sparsification on GNN Pipelines

この論文は、大規模グラフにおける GNN パイプラインのボトルネックであるデータ移動コストを軽減しつつ、ノード分類タスクの精度を維持または向上させることを示すため、グラフスパース化が軽量な前処理として有効であることを体系的に検証した研究です。

Yuhang Song, Naima Abrar Shami, Romaric Duvignau, Vasiliki KalavriTue, 10 Ma🤖 cs.LG