EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution
本論文は、データベーススキーマの進化がテキストから SQL への変換モデルの性能に与える影響を評価・改善するための包括的なベンチマーク「EvoSchema」を提案し、スキーマ変更の多様なタイプをシミュレートすることでモデルの堅牢性を向上させる道筋を示しています。
2316 件の論文
本論文は、データベーススキーマの進化がテキストから SQL への変換モデルの性能に与える影響を評価・改善するための包括的なベンチマーク「EvoSchema」を提案し、スキーマ変更の多様なタイプをシミュレートすることでモデルの堅牢性を向上させる道筋を示しています。
この論文は、リーマン多様体上の生成モデルにおいて、並行移動を用いた平均速度場と対数写像表現を組み合わせることで、数値積分や軌道シミュレーションなしに高品質なワンステップサンプリングを実現する「リーマン平均フロー(RMF)」を提案し、球面や SO(3) などの多様体上でその有効性を実証しています。
この論文は、予測器を用いて事前ラベル付けを行う学習強化型k-メディアンクラスタリング問題に対し、次元依存性を緩和し計算複雑性を大幅に改善する「サンプリング&サーチ」という効率的なアルゴリズムを提案し、実験によりその有効性を示したものである。
この論文は、マルチテナント LLM 推論システムにおけるプレフィックスキャッシングのタイミング側面チャネル攻撃を、ユーザー間の完全な隔離ではなく、疑わしい共有のみを動的に制限する「CacheSolidarity」という軽量システムにより、性能と効率を犠牲にすることなく防御することを提案しています。
本論文は、Fashion-MNIST データセットを用いた実験を通じて、H-CNN VGG16 と GoogLeNet の二つのアーキテクチャにおけるモンテカルロドロップアウトとコンフォーマル予測による不確実性推定を比較し、GoogLeNet がより適切に較正された不確実性を示し、コンフォーマル予測が統計的に保証された予測セットを提供することで高リスクな意思決定における信頼性の向上に寄与することを明らかにしています。
この論文は、ドキュメント化に依存する従来の手法の限界を克服し、ランタイムでデータ漏洩を検知・拒否する7つのカーネルプリミティブと4つの制約からなる構造的な文法を提案し、その有効性を3つの言語実装と大規模な実証研究によって立証しています。
既存の深層学習モデルを再学習させることなく、任意の層にプラグインとして挿入可能な汎用モジュール「CUPID」を提案し、単一のモデルで確率的(Aleatoric)および認識論的(Epistemic)な不確実性を同時に推定し、その発生源を層ごとに解釈可能にする手法を提示しています。
この論文は、データサンプルのみを用いて自動エンコーダを設計し、通信負荷を削減しながら未知の目標分布と出力分布の総変動距離を最小化することで、共通乱数が限定的な状況でも強力な関数計算を保証する深層学習ベースの分散型関数計算フレームワーク「DeepRDFC」を提案しています。
この論文は、物理的複製不可能関数(PUF)を活用してニューラルネットワークの重みを固有のハードウェア特性に結びつけることで、複製されたハードウェア上でのモデル実行を不可能にし、知的財産の保護を実現する手法を提案しています。
本論文は、無線フェデレーテッドラーニングにおいて勾配の符号を優先し、パケットおよびデバイスレベルでの重要度に基づく階層的リソース配分を最適化することで、通信制約下でも高精度なモデル学習を実現する「SP-FL」という新たな枠組みを提案しています。
この論文は、高次元カオス力学系における極端事象の予測精度を向上させるため、支配方程式を必要とせずに最適時間依存(OTD)モードを用いて過渡的不安定性を効率的に捉えた解釈可能な前兆指標を構築し、これをトランスフォーマーモデルに組み込んだデータ駆動型フレームワークを提案するものである。
この論文は、視覚言語モデルの生きた活性化値(スカラー値)を直接探ることで「スーパーニューロン」を発見し、これを用いることで従来のネットワークに比べて最大 5.10 倍の高速化を実現しつつ、カテゴリー別 VQA タスクの分類精度を向上させることを提案しています。
この論文は、5G/6G のネットワーク計画において、空間的自己相関によるデータリークを軽減し、文脈を考慮した二段階分割戦略と残差空間誤差補正を組み合わせた AI フレームワークを提案し、カナダの主要都市での実証実験により予測精度の向上と信頼性の高い帯域幅割り当ての実現を立証したものです。
本論文は、公共の展開記録からスペクトル需要の代理指標を構築し、階層的マルチ解像度のグラフ注意ネットワーク(HR-GAT)を用いて微細な空間スケールでの需要を高精度に推定することで、無線ネットワークにおけるスペクトル共有と割り当てを支援する新しい手法を提案しています。
この論文は、拡散モデルを事前分布として用いた潜在空間最適化フレームワーク「MCCOP」を提案し、タンパク質の望ましい特性を達成するための最小かつ生物学的に妥当な変異を特定することで、機械学習モデルの解釈性とタンパク質設計の指針を提供するものである。
この論文は、敵対的攻撃に対する軌道予測モデルの堅牢性を向上させつつ、通常時の精度を維持できる簡便かつ計算コストの低い防御手法として、ランダム化スムージングを提案し、その有効性を検証したものである。
ReTabSyn は、強化学習を用いて特徴量間の相関を直接評価し、条件付き分布の学習を優先させることで、データ不足や不均衡といった制約下でも下流タスクの性能を向上させる現実的な表形式データ合成パイプラインを提案するものである。
この論文は、データ不足に直面する NPU などのニッチなハードウェア生態系におけるカーネル合成の課題を解決するため、価値駆動型のメモリ機構と強化学習を用いて、大規模言語モデルがゼロスタートから自律的にカーネルを生成・改善するエージェントフレームワーク「EvoKernel」を提案し、大幅な正解率と高速化の向上を実証したものである。
この論文は、事前学習された汎用価値モデルを事前分布として活用し、リアルタイム統計検定に基づいて希薄なロールアウトの予算を動的に割り当てることで、推定誤差を最小化し安定した方策勾配を実現する新しい価値モデル「V0.5」を提案し、数学的推論ベンチマークにおいて既存手法を大幅に上回る性能を示したことを述べています。
本論文は、EnMAP 衛星の hyperspectral 画像の大気補正を自動化し、特に水域における高精度な水面反射率の取得を可能にする、6S モデルと Google Earth Engine API を統合したオープンソース Python フレームワーク「6ABOS」を提案し、地中海の 2 つの貯水池での実証によりその有効性を示したものである。