Frequentist Consistency of Prior-Data Fitted Networks for Causal Inference
この論文は、事前データ適合ネットワーク(PFN)に基づく因果推定推定量が頻度論的整合性を欠く問題を指摘し、マルティンゲール事後分布を用いた一歩事後補正(OSPC)を導入することで、平均処置効果(ATE)の推定において頻度論的整合性と適切な不確実性定量化を回復させる手法を提案しています。
3821 件の論文
この論文は、事前データ適合ネットワーク(PFN)に基づく因果推定推定量が頻度論的整合性を欠く問題を指摘し、マルティンゲール事後分布を用いた一歩事後補正(OSPC)を導入することで、平均処置効果(ATE)の推定において頻度論的整合性と適切な不確実性定量化を回復させる手法を提案しています。
この論文は、文内や意味的に一貫した区間におけるアテンションサポートの安定性という観察に基づき、既存のモデルを再学習することなく推論コストを大幅に削減し、品質を維持しながらスループットを向上させるトレーニングフリーの「Slow-Fast Inference」フレームワークを提案しています。
本論文は、事前学習済み視覚言語モデルの継続学習において、対抗的アンカーと幾何学的蒸留を用いて新旧タスク間のセマンティック幾何構造を保存し、エクスンプラフリー制約下でカタストロフィックフォージングを抑制する「SeGP-CL」という手法を提案し、複数のベンチマークで最先端の性能を達成したことを報告しています。
この論文は、隠れ層を持たない化学反応ネットワークが、隠れ層を必要とするスパイクニューラルネットワークよりも優れた学習能力と分類精度を数学的に証明し、生化学的反応ネットワークが生物学的学習においてより効率的である可能性を示唆しています。
この論文は、転写因子の結合部位予測を単一の因子や二値分類ではなく、転写因子間の相関や協調的な制御メカニズムを捉える多ラベル分類問題として定式化し、時系列畳み込みネットワーク(TCN)を用いて生物学的に意味のあるモチーフや新たな共結合パターンを抽出する深層学習フレームワークを提案しています。
この論文は、ドメイン間の状態・行動空間の不一致と負の転移という課題を、転移可能性を測定する「クロスドメイン・ベルマン整合性」と、ソースおよびターゲットドメインの Q 関数を適応的に結合するハイブリッドクリティック「QAvatar」を導入することで解決し、効率的なクロスドメイン強化学習を実現する手法を提案しています。
この論文は、単一のコンシューマー向け GPU 上で大規模言語モデル(LLM)の微調整なしに、履歴フィードバックメモリと双 LLM 特化アプローチを用いて効率的に画像分類用ニューラルネットワークを自動設計し、低予算かつ再現性のあるハードウェア認識型 NAS パラダイムを確立する手法を提案するものです。
本論文は、バッチベイズ最適実験設計における非凸な最適化課題に対処するため、設計測度空間への確率的リフティングとエントロピー正則化を導入し、Wasserstein 勾配流に基づく粒子アルゴリズムを提案して、多峰性の最適化 landscapes を探索し高効用な実験バッチを効率的に生成する手法を確立したものである。
本論文は、ユーザー方策と敵対的擾乱方策間のミニマックス最適化に分数目的関数を導入して安定化を図る「MMDDPG」という枠組みを提案し、連続制御タスクにおける外乱やモデル不確実性に対するロバスト性を大幅に向上させることを示しています。
Cornserve は、任意のモダリティの入出力を可能とする Any-to-Any マルチモーダルモデルの計算グラフを柔軟に表現し、コンポーネントの分離と独立したスケーリングを実現することで、高いスループットと低いレイテンシを提供する分散推論システムです。
この論文は、マルチモーダル大規模言語モデルを活用して高品質な対話データを構築し、テキストから忠実かつ高品質な 3 次元の人間 - 物体相互作用メッシュを生成する新しいフレームワーク「Hoi3DGen」を提案し、既存手法を大幅に凌駕する性能を示したものである。
この論文は、汎用的なプロンプトテンプレート、階層的検証、反復的エージェント支援修復という手法を用いて、数ヶ月の専門的エンジニアリングを要していた複雑な強化学習環境を、10 ドル未満の計算コストで高性能かつ意味的に同等な実装へ自動変換する画期的なレシピを提案し、5 つの環境における大幅な高速化とゼロのシミュレーション間ギャップを実証しています。
本論文は、従来の多段階生成モデルの時間的冗長性を解消しつつ、動画の画質と軌跡の精度を両立させるために、軌跡アダプターの事前学習、生成器の少ステップ化、そしてハイブリッドな微調整戦略を組み合わせた新しいフレームワーク「FlashMotion」と、その評価用ベンチマーク「FlashBench」を提案するものである。
この論文は、大規模言語モデルの強化学習における計算リソースの最適配分を明らかにし、問題ごとの並列ロールアウト数を計算予算に応じて増やすことで、簡単な問題では解の鋭敏化を、難しい問題では探索範囲の拡大を促進し、効率的な学習を実現する実践的な指針を提供しています。
この論文は、二成分混合モデルを用いた理論的枠組みを構築し、KL 発散の方向性、幾何学的な行動の重なり、サンプリング戦略、および過去の行動の可視性が、生成モデルの継続的学習における「質量の消失」と「成分のドリフト」という 2 種類の忘却をどのように定量的に決定するかを明らかにしています。
本論文は、単一の機械学習原子間ポテンシャルの信頼性不足を克服し、敵対的検証、ブートストラップ推定、Lean 4 による形式的証明の 3 段階プロセス「Proof-Carrying Materials」を導入することで、安定材料の発見率を 25% 向上させ、計算材料科学における安全性保証を実現する手法を提案しています。
本論文は、スパースアテンションにおけるクロスレイヤーのインデックス再利用を活用し、インデックス計算を最大 75% 削減しながら品質を維持し、プリフィル速度を最大 1.82 倍、デコード速度を 1.48 倍向上させる「IndexCache」という手法を提案しています。
本論文は、マクロおよびマイクロの両方の粒度で確率的なゲート機構を導入し、単一のエンドツーエンド学習フェーズで視覚トランスフォーマーの最適な部分ネットワークを自動的に発見する階層的自動プルーニングフレームワーク「HiAP」を提案し、複雑な多段階パイプラインを不要にしながらエッジデバイス向けの高精度かつ高効率なアーキテクチャを実現することを示しています。
この論文は、医療記録や映画レビューなどの自由記述テキストをCLIPモデルの埋め込み空間にマッピングし、ファジィルールベースの分類システムを用いてドメイン固有の文脈を解釈する手法を提案し、その有効性と限界について議論するものである。
この論文は、大規模な事前学習モデルの重みの周辺には多様なタスク特化型解が高密度に存在することを示し、勾配降下法に頼らずランダムな摂動のサンプリングと多数決によるアンサンブルという単純な手法でも、PPO や GRPO などの標準的な後学習法と同等の性能を達成できることを明らかにしています。