Fine-Grained Table Retrieval Through the Lens of Complex Queries
この論文は、複雑な自然言語クエリに対するオープンドメインの質問応答を可能にするため、細粒度の型付きクエリ分解とグローバルな接続性認識を組み合わせたテーブル検索手法「DCTR」を提案し、その有効性を検証したものです。
84 件の論文
この論文は、複雑な自然言語クエリに対するオープンドメインの質問応答を可能にするため、細粒度の型付きクエリ分解とグローバルな接続性認識を組み合わせたテーブル検索手法「DCTR」を提案し、その有効性を検証したものです。
この論文は、大規模データレイクにおいてクエリテーブルに対して新たな情報を提供する結合可能なテーブルを探索する「Novel Table Search(NTS)」問題を定義し、その最適化問題が NP 困難であることを示した上で、効率的な近似手法「ANTs」を提案し、実験を通じてその有効性と高速性を実証しています。
この論文は、有限極限スケッチを用いてデータベースのパラダイムを形式化する「スケッチ指向データベース」という枠組みを提案し、グラフ特徴の統一的な表現や経路推論、そしてモジュール化とスケーラビリティを可能にする「スタッタリングスケッチ」の導入を通じて、データベース理論の一般化と拡張を示しています。
この論文は、大規模で複雑なデータベースにおける外部キーの検出を目的とした、4 つの専門エージェントが協調して探索空間の爆発や文脈の曖昧さ、局所予測の矛盾といった課題を解決する初の完全自動化マルチエージェントフレームワーク「LLM-FK」を提案し、既存手法を大幅に上回る精度とスケーラビリティを実証したものです。
この論文は、複雑なスキーマやレガシーシステム、厳格なデータガバナンスに直面する信用組合向けに、自然言語での企業データベース検索を可能にする安全なオンプレミス型プラットフォーム「Tursio」を提案し、大規模言語モデルを活用して意味知識グラフを自動推論し、意図を文脈化して正確かつコンプライアンスに準拠したクエリ計画を生成する仕組みを説明しています。
この論文は、LinkedIn における Apache Pinot の実運用で開発され、リソース分離、影響の少ないリバランス、障害耐性のある配置、適応型サーバー選択などのメカニズムを通じて、大規模 OLAP システムの堅牢性と SLA 遵守を達成する包括的なフレームワークを提案しています。
本論文は、異なる SQL 方言を持つ多様なデータベースシステムに対応し、構文と意味の両面で正確なクエリ生成を実現するために、方言認識論理クエリ計画モジュール、階層的意図認識知識ベース、および実行駆動型デバッグループを導入した「Dial」という知識基盤型 NL2SQL 枠組みを提案し、新しいベンチマーク DS-NL2SQL による実験で最先端手法を上回る性能を示したものである。
この論文は、複雑な空間オブジェクトの効率的な検索を実現するため、粗い最小境界矩形に代わって微細なグリッドセルをプレフィックス木構造に組み合わせた新しいインメモリ空間インデックス「GP-Tree」を提案し、実データによる実験で従来の手法を最大で桁違いに凌駕する性能向上を実証しています。
この論文は、DHT のフィンガーテーブルを活用したパッシブな安定化メカニズムと版数ベクトルを導入することで、グローバルな協調なしに大規模なモバイルアドホックネットワークにおけるネットワーク分断に耐性を持ち、メッセージ複雑度を削減しながら最終的な一貫性を保証する「構造化されたゴシップ DNS」を提案しています。
本論文は、リレーショナルデータベースにおける不均衡データ問題に初めて着目し、関係性ごとのゲート制御と関係性ガイドの少数派合成を用いて不均衡なエンティティ分類を改善する深層学習手法「Rel-MOSS」を提案し、既存手法を上回る性能を実証したものである。
本論文は、大規模な表コレクションにおける数値多表質問応答の課題を解決するため、表関係グラフの構築、質問分解とカバレッジを考慮した表検索、および部分質問に基づく推論プログラム生成を組み合わせた「DMRAL」フレームワークを提案し、既存手法を大幅に上回る性能を実証したものである。
本論文は、Rust で実装され、グラフ・ベクトル・最適化ワークロードを単一のエンジンに統合し、インデータベース最適化やエージェントによる拡張、ハードウェアアクセラレーションを実現する高性能データベース「Samyama」を提案し、汎用ハードウェア上でも競合する性能を発揮することを示しています。
この論文では、部分グラフマッチングにおける重複計算を削減し、探索木の枝を剪定する新たなアルゴリズム「CEMR」を提案し、実データセットでの実験により既存の最先端手法を上回る性能を実証しています。
本論文は、暗号資産取引所における非線形なエッジ重みを持つ大規模グラフ上の経路探索問題(TGRP)に対して、剪定グラフ探索と適応符号勾配法(ASGM)を用いた二段階アルゴリズム「PRIME」を提案し、実世界のデータにおいて既存の Uniswap ルーティングアルゴリズムを上回る実行価格と計算効率を実現したことを示しています。
LLM を用いた非構造化テキスト分析のリアルタイム応答性を向上させるため、全データ処理を待たずに漸進的な結果を提供するオンライン集約フレームワーク「OLLA」と、収束を加速させる意味的層化サンプリング手法を提案し、実験により高精度かつ大幅な高速化を実現したことを示す論文です。
この論文は、回路を用いた手法により、負の原子を含む結合クエリ(符号付き結合クエリ)に対する直接アクセスの計算量理論を一般化し、正の結合クエリにおける既知の結果を回復するとともに、-非循環や有界ネスセット幅を持つ負の結合クエリなど、新たな tractable なクラスを特定するものです。
本論文は、リレーショナル計算と代数を拡張した「カテゴリカル計算」と「カテゴリカル代数」という 2 つの形式クエリ言語を提案し、それらの等価性、最適化のための変換規則、および表現力と計算複雑性を分析することで、マルチモデルデータベースの理論的基盤を確立するものである。
本論文は、複数の頂点被覆の線形結合に基づいてハイパーキューブの共有を最適化し、入力サイズ とプロセッサ数 に対して負荷 ( は新たな「縮小準頂点被覆」)を実現する単純かつ高性能な並列結合アルゴリズム「K-Join」を提案するものである。
この論文は、大規模な地理空間データのクライアントサイド可視化におけるタイルサイズと視覚的忠実性のトレードオフを解決し、NP 困難な問題を情報理論的・空間的基準に基づく二段階の削減手法で効率的に処理するフレームワーク「HiFIVE」を提案しています。
この論文は、時空間データセットの圧縮において時間・空間の両次元をバランスよく圧縮し、クラスタレベルとサブセットレベルの手法を組み合わせることで、従来の手法よりも高速かつメモリ効率よく、かつ予測精度を向上させた新しい時空間データセット蒸留手法「STemDist」を提案するものである。