PANDAExpress: a Simpler and Faster PANDA Algorithm
本論文は、PANDA アルゴリズムの欠点であった隠れた多項対数因子を除去し、任意の次数制約下での結合クエリや論理規則に対する出力サイズをより効率的に評価する新しい確率不等式と、データのスケーリングに基づいた動的超平面切断を用いた「PANDAExpress」というより簡潔で高速なアルゴリズムを提案するものである。
87 件の論文
本論文は、PANDA アルゴリズムの欠点であった隠れた多項対数因子を除去し、任意の次数制約下での結合クエリや論理規則に対する出力サイズをより効率的に評価する新しい確率不等式と、データのスケーリングに基づいた動的超平面切断を用いた「PANDAExpress」というより簡潔で高速なアルゴリズムを提案するものである。
本論文は、大規模な動的グラフにおけるコミュニティ検出の効率化を目的とし、既存手法の非効率性を克服して更新頻度が高い環境でも最大 5 桁の高速化を実現する新規アルゴリズム「HIT-Leiden」を提案し、その品質と実用性を検証したものである。
本論文は、モデルの計算経路に基づく局所性を活用してデータ価値評価の計算複雑性を大幅に削減し、影響のある部分集合を最適に再利用する効率的なアルゴリズム「LSMR」およびその近似版「LSMR-A」を提案するものである。
本論文は、大規模言語モデルによる SQL 生成における構文・意味エラーを明示的にモデル化する専用フレームワーク「ErrorLLM」を提案し、構造的特徴と専用エラートークンを用いた高精度なエラー検出と SQL 修正により、既存手法の限界を克服し生成精度を大幅に向上させることを示しています。
本論文は、データから機械学習ランタイムへのエクスポートに伴うオーバーヘッドやセキュリティリスクを解消するため、AI モデルをデータベースエンジンに直接統合する「AIxDB」ワークロードのオーケストレーションにおいて直面するクエリ最適化、実行スケジューリング、セキュリティ保証などの課題を論じ、その解決に向けた設計と予備結果を示すものである。
本論文は、構造的因果モデルに基づく合成データ生成により、実世界のデータベースの制約を克服し、200 万件以上のタスクで事前学習された初のリレーショナル基盤モデル「RDB-PFN」を提案し、少量のサンプルで多様な実世界タスクにおいて強力な推論性能を実現することを示しています。
SpotIt+ は、ルールベースのマイニングと LLM による検証を組み合わせてデータベース制約を抽出し、生成された SQL と正解 SQL の違いをより現実的なデータベース例で特定する、テキストから SQL へのシステム評価のためのオープンソースツールです。