Modeling Concurrency Control as a Learnable Function
本論文は、ベイズ最適化とグラフ削減探索アルゴリズムを用いて既存の並行制御アルゴリズムの設計選択を学習し、効率的なデータベース内ルックアップテーブルとして実装された新しい学習型並行制御アルゴリズム「NeurCC」を提案し、多様なワークロードにおいて従来の最先端手法を上回る高いトランザクションスループットと最適化速度を実現することを示しています。
84 件の論文
本論文は、ベイズ最適化とグラフ削減探索アルゴリズムを用いて既存の並行制御アルゴリズムの設計選択を学習し、効率的なデータベース内ルックアップテーブルとして実装された新しい学習型並行制御アルゴリズム「NeurCC」を提案し、多様なワークロードにおいて従来の最先端手法を上回る高いトランザクションスループットと最適化速度を実現することを示しています。
この論文は、SQL と AI/ML を組み合わせたハイブリッドクエリ向けの最適化手法を、DuckDB ベースの統合バックエンドとインタラクティブな Web インターフェースを通じて公平かつ透明性高く構築・比較・可視化することを可能にする「OptBench」という対話型ワークベンチを提案するものである。
この論文は、大規模な疎テンソル計算において、計算集約的な部分を効率的な数値カーネルで実行し、疎性をリレーショナルシステムで管理できるよう、古典的なアインシュタインの総和記法をテンソル関係計算向けに拡張した「EinSum」を提案し、その自動書き換え手法を研究するものである。
本論文は、合意プロトコルとストレージエンジン間の重複する永続化操作による I/O オーバーヘッドを解消するため、キー・バリュー分離と Raft を最適化して統合し、Put/Get/Scan 操作で大幅なスループット向上を実現した分散キーバリューストア「Nezha」を提案するものである。
この論文は、文脈長の制約や幻覚、単一エージェントの限界といった既存の表質問応答(TableQA)の課題を克服するため、データリーダー、データベースチーム、知識グラフチームによる協調と自動知識変換を導入したマルチエージェントフレームワーク「DataFactory」を提案し、複数のベンチマークで大幅な精度向上を実証したものである。
本論文は、大規模言語モデル(LLM)を用いたインデックス調整が、Microsoft のデータベース調整アシスタント(DTA)よりも優れた実行時間を達成する可能性を示す一方で、その性能のばらつきや実運用への統合の難しさから、現状では補完的な技術として位置づけられるべきであることを、ベンチマークおよび実企業ワークロードを用いた評価を通じて明らかにしています。
本論文は、AI によるベクトル検索の最適化と、ベクトル検索による AI(特に RAG)の能力拡張という相互強化関係(「好循環」)を体系的に解説し、ICDE 2026 において発表されたチュートリアルである。
本論文は、サイクリングや航空、海事追跡などの実世界のユースケースを反映し、スケーラビリティや設定の影響、プラットフォーム間の性能比較を含む包括的な評価を可能にする、オープンソースのアプリケーション中心時空間データベースベンチマークスイート「GeoBenchr」を提案するものである。
本論文は、有界導出深さの存在則集合が有限制御性を満たすという未解決の予想に対し、その反例となり得る普遍モデルがループクエリを導出しない限り任意に大きなトーナメント(有向完全グラフ)を含むことができないことを示すことで、予想の肯定的解決に向けた重要な一歩を踏み出したものである。
この論文は、ランキングアルゴリズムのデータへの微小な変化に対する感度を評価する「局所安定性」という新たな指標を提案し、その計算の困難さを克服するための近似アルゴリズムと密な領域の検出手法を開発して、大規模な実験によりその有効性を検証したものである。
この論文は、LLM の物理的仮定を見落とすという課題を解決し、数値シミュレーションにおいて支配方程式の欠落メカニズムを自律的に推論・補完して物理的に整合的な結果を導き出す「認識的閉鎖」を実現するニューロ記号的生成エージェントを提案するものである。
この論文は、GQL 標準の改訂を背景に、PG-Keys 言語を既存の制約言語(GFD や GGD)と比較・評価するための統一枠組みを提案し、構造的な差異に基づいた完全かつ厳密な表現力の階層を確立することで、PG-Keys の表現能力が厳密に優越する条件を明らかにするものです。
本論文は、データベースシステムが SSD の性能を最大限に引き出し寿命を延ばすために、B-tree ベースの LeanStore を再設計してアウト・オブ・プレイス書き込みを最適化し、トランザクションごとのフラッシュ書き込みを大幅に削減しながらスループットを向上させる手法を提案・評価したものである。
既存の協調学習ベンチマークが現実のデータサイロの複雑さ(非整合性や結合不可能性など)を無視しているという課題に対し、10 万の現実世界データベースと 1700 万の関連性から構成される大規模データセット「WikiDBGraph」を構築し、協調学習システムの実用的な評価と改善の方向性を提示する。
本論文は、表形式データの理解・推論・操作に関する専門家のレベルを包括的に評価するため、25 の実世界タスクと 2 万 8 千以上の質問からなる大規模ベンチマーク「MMTU」を提案し、最先端のモデルでも高い性能が求められていることを示しています。
本論文は、大規模言語モデルを用いて表データに実在の誤りを生成するフレームワーク「TableEG」を提案し、これにより合成データと実世界データの誤り分布のギャップを埋め、データクレンジング手法の信頼性あるベンチマーク確立を実現したことを示しています。
本論文は、データ分布やリソースの多様性に対応し、ローカルとグローバルな知識の矛盾を解消するため、固定長のグローバルプロンプトと可変長のローカルプロンプトを組み合わせ、部分空間微調整と発散制御を導入した新しいフェデレーティドプロンプト学習フレームワーク「SDFed」を提案し、その有効性を示すものである。
本論文は、現代の AI アプリケーションが求める高効率な検索、高速インデックス作成、低メモリ使用量などの 6 つの要件をすべて満たすため、投影技術とグラフインデックスを統合した新しい近似最近傍検索フレームワーク「PAG」を提案し、HNSW より最大 5 倍高速な検索性能を実現することを示しています。
この論文は、プロパティグラフにおけるメタデータの冗長性と意味的不整合を解消するため、繰り返し現れるメタデータを標準化された「特性ノード」として抽出・正規化する「第 5 正規化形(5GNF)」という新たな枠組みを提案し、その有効性を北風データセットを用いた実証実験で示しています。
この論文は、大規模グラフにおける GNN パイプラインのボトルネックであるデータ移動コストを軽減しつつ、ノード分類タスクの精度を維持または向上させることを示すため、グラフスパース化が軽量な前処理として有効であることを体系的に検証した研究です。