Invariance-Based Dynamic Regret Minimization
本論文は、報酬モデルが定常成分と非定常成分に分解されると仮定し、過去のデータから不変性を学習して活用する「ISD-linUCB」というアルゴリズムを提案することで、非定常線形バンドット問題における動的後悔を理論的・実証的に大幅に改善することを示しています。
335 件の論文
本論文は、報酬モデルが定常成分と非定常成分に分解されると仮定し、過去のデータから不変性を学習して活用する「ISD-linUCB」というアルゴリズムを提案することで、非定常線形バンドット問題における動的後悔を理論的・実証的に大幅に改善することを示しています。
本論文は、複数の関連する物理システムからのデータを統合的に利用し、階層的ベイズ推論と ML ベースの閉じ込めモデル学習を組み合わせる新しい手法を提案し、その計算効率を向上させるために bilevel 最適化戦略を用いて FNO や PINN などの代理モデルを同時に訓練することで、ODE/PDE 逆問題の解決を可能にするものである。
本論文は、複数の属性を持つ腕がすべて閾値を超えて初めて実行可能とみなされるグループ化バンディット問題において、実行可能性を保証しつつ最良の腕を特定するための新しいアルゴリズム「FCSR」を提案し、その誤り確率の下限導出と最適性を示しています。
本論文は、最大値と和の演算を用いた Max-Plus 神経ネットワークの非滑らかな性質から生じる勾配の疎性を標準的な逆伝播が活用できていない課題に着目し、最悪ケース損失の最小化を通じてこの疎性を明示的に利用する新たなスパース部分勾配法を提案することで、効率的かつ理論的保証を持つ学習を実現するものである。
この論文は、重み正則化(特に L2 正則化)を導入することで、スパースオートエンコーダの学習特徴量の一貫性を高め、安定性とステアリング成功率を向上させつつ、自動解釈可能性スコアを維持できることを示しています。
この論文は、対数尤度という観点から一般化平均を用いた密度集約を統一的に分析し、 の範囲(線形および幾何学的プーリングを含む)が個々の分布に対して体系的な改善を保証する唯一の領域であることを理論的に示し、深層アンサンブルを用いた実証評価でその妥当性を裏付けています。
本論文は、対データと非対データの両方から潜在空間を学習し、対データのみを用いて 1-ワッサーシュタイン距離による分布整合を行う「潜在空間分布整合(LSDM)」という新しい半教師あり生成モデルを提案し、その理論的保証と Latent Diffusion Models への理論的洞察、および実画像タスクにおける生成品質の向上を実証しています。
この論文は、勾配共有に代わって永続ホモロジーに基づく位相記述子を用いることで、データ再構成攻撃への耐性と非 IID 環境における個人化学習の精度を同時に向上させる新たな連合学習フレームワーク「PTOPOFL」を提案し、その理論的保証と医療および病理データを用いた実験による有効性を示しています。
本論文は、量子ニューラルネットワークの設計を「状態到達性」から「学習能力」へと転換し、データと重みの結合依存性に基づく幾何学的柔軟性(aCLS)が隠れた量子表現の制御を可能にすることで、性能向上と資源効率化を実現する幾何学的設計原則を提案している。
この論文は、非平衡熱力学に着想を得た拡散確率モデルを用いて、CIFAR10 および LSUN データセットにおいて最先端の画像合成性能を達成したことを報告しています。
この論文は、言語モデルの性能がモデルサイズやデータ量、計算リソースに対してべき乗則に従ってスケーリングし、限られた計算予算を最も効率的に活用するには、比較的小さなデータで非常に大規模なモデルを学習させることが最適であることを実証的に示しています。
この論文は、データ分布を捉える生成モデルと訓練データからのサンプルを識別する判別モデルを敵対的に訓練する最小最大ゲームの枠組みを提案し、マルコフ連鎖や近似推論ネットワークを必要とせずに多層パーセプトロンを用いて効率的に学習できることを示しています。
この論文は、連続潜在変数を持つ大規模な方向性確率モデルにおいて、変分下限の再パラメータ化と近似推論モデル(認識モデル)の導入により、非効率な事後分布に対しても標準的な確率勾配法を用いた効率的な推論と学習を可能にする「自動符号化変分ベイズ(Auto-Encoding Variational Bayes)」手法を提案しています。