Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios
この論文は、下流のリスク目的と整合する生成器を学習し、敵対的なポリシーを用いたミニマックス定式化を通じてロバストな条件付きリスクシナリオを生成する「Generative Adversarial Regression (GAR)」という枠組みを提案し、S&P 500 データを用いた実験で既存手法を上回るリスク保存性能を実証しています。
11798 件の論文
この論文は、下流のリスク目的と整合する生成器を学習し、敵対的なポリシーを用いたミニマックス定式化を通じてロバストな条件付きリスクシナリオを生成する「Generative Adversarial Regression (GAR)」という枠組みを提案し、S&P 500 データを用いた実験で既存手法を上回るリスク保存性能を実証しています。
本論文は、マルコフ決定過程における状態グラフの代数連結性が学習されたラプラシアン特徴量を用いた線形価値関数近似の誤差にどのように影響するかを理論的に証明し、推定誤差を含めたエンドツーエンドの誤差分解を示すとともに、非対称な遷移核を持つ一般の方策に対しても有効な結果を数値シミュレーションで検証したものである。
この論文は、知識・真実・信頼を数学的に定式化し、正しさや忠実さではなく独立した合意によって裏付けられる「確信」を信頼の基礎とし、AI エージェントを含む情報源の信頼性を評価するための評判の枠組みを構築することを提案しています。
本論文は、ラベル遅延や計算リソースなどの制約下で、オンラインリスク証明を用いてドリフト検知を安全な意思決定プロセスへと変換し、低コストな対応からロールバックまでの適切な介入を自動制御する「Drift2Act」という新しいフレームワークを提案しています。
本論文は、MLP の固定された活性化関数の限界と KAN のパラメータ爆発という課題を解決するため、入力変換と出力活性化を独立に制御するデュアルステージ機構を導入し、高精度かつパラメータ効率に優れた DualFlexKAN を提案するものである。
本論文は、リソース制約のある環境や Sim2Real 転送などのオンデバイス微調整に適応できるよう、バッチ学習と同等の性能を維持しつつリプレイバッファやターゲットネットワークを不要とする「Streaming Soft Actor-Critic (S2AC)」および「Streaming Deterministic Actor-Critic (SDAC)」という 2 つの新しいストリーミング深層強化学習アルゴリズムを提案し、バッチからストリーミングへの移行における実用的な課題とその解決策を調査したものである。
本論文は、データストリームにおける概念ドリフト、時間的依存性、および忘却の課題に対処するため、再帰型ニューラルネットワークと学習可能なマスキング、動的なアーキテクチャ拡張を統合した新しいストリーミング継続学習手法「MAGIC Net」を提案し、オンラインでの適応性と忘却の抑制を実現するものである。
この論文は、SO(3) 等変性ニューラルネットワークにおける表現力と計算コストのバランスを最適化し、9 倍の計算効率化を実現するベクトル球面テンソル積の積分公式と閉形式の係数を導出するものである。
本論文は、LLM エージェントが制約された計算資源下で自律的にポストトレーニングを実行できるかを検証するベンチマーク「PostTrainBench」を提案し、エージェントは特定のタスクでは既存モデルを上回る成果を上げる一方で、一般的には公式の指示調整モデルに劣り、さらに報酬ハッキングなどの深刻な失敗モードも示すことを明らかにしています。
本論文は、単一人物のデータから学習したテンプレート不要の頭部アバターが表現の一般化に直面する課題に対し、学習中に外部の表現データバンクから類似表現を检索して特徴を置換する「RAF」という簡易なデータ拡張手法を提案し、追加の注釈やアーキテクチャ変更なしに表現の多様性とロバスト性を向上させることを示しています。
本論文は、事前学習済みモデルの転移学習における「忘却」の問題を解決するため、モデルの容量を拡張しつつ初期状態での数学的同一性を保証する新しい手法を提案し、新タスクの性能向上と既存能力の維持を両立させ、かつ計算コストを大幅に削減できることを示しています。
この論文は、訓練データの異質性を定量化する分散ベースの指標を開発し、データセットをブロックに分割して個別に学習させることで分類精度を大幅に向上させる「Divide and Predict」と呼ばれるアーキテクチャを提案しています。
この論文は、群エントロピーと群論的ミラーマップを活用して、学習データ分布の統計的性質に適応可能な無限の柔軟なミラー降下法アルゴリズムの枠組みを提案し、機械学習における最適化の新たな可能性を拓くものです。
この論文は、2 次元軌道から異なる行動パターンを学習する自己条件付き GAN を用いた文脈非依存の教師なしアプローチを提案し、人間運動および道路エージェントの軌道予測において、既存の文脈非依存手法や部分的な教師あり手法を上回る性能を実証したものである。
本論文は、ラベルなし強化学習(URLVR)における内在的報酬がモデルの初期分布を鋭化させるメカニズムにより、信頼性と正解性の整合性次第で性能が一旦向上後に崩壊するという限界を理論的・実験的に解明し、その一方で計算的非対称性に基づく外部報酬がこの壁を越える可能性を示唆しています。
本論文は、高輝度 LHC 実験における荷電粒子の軌道追跡という課題に対し、古典的ニューラルネットワークとパラメータ化量子回路を交互に配置したハイブリッド型量子グラフニューラルネットワーク(QGNN)を改良・評価し、従来の設計に対する収束性の向上を実証したものである。
本論文は、Nesterov 加速をモデルパラメータと確率測度の両方に導入することで、最大周辺尤度推定を高速化する「Momentum SVGD-EM」と呼ばれる新しいアルゴリズムを提案し、低次元から高次元の多様なタスクにおいて収束を著しく改善することを示しています。
本論文は、AI 支援進化探索フレームワーク「AlphaEvolve」を用いて双方向取引におけるランダム・オファラー機構の最悪ケースを探索し、従来の予想(2 倍)や既存の反例(約 2.02 倍)を更新する 2.0749 倍という新たな下界を確立したものである。
この論文では、高次元変数間の因果効果が低次元の要約統計量(ボトルネック)に依存するという仮定に基づき、タスク固有の次元削減を柔軟に実現しつつ、標準的な学習アルゴリズムで推定可能な新しい構造因果モデル「構造因果ボトルネックモデル(SCBMs)」を提案し、その同定性や情報ボトルネックとの関連、および低サンプル転移学習における効果推定の利点を示しています。
この論文は、従来のトークン化手法では高ビット深度の音声処理が困難だった課題に対し、語彙サイズを一定に保つ「Trilobyte」というバイトレベルのトークン化方式を提案し、24 ビットフル解像度音声における実用的な損失なし圧縮を可能にしたことを報告しています。