Ergodic McKean-Vlasov Games: Verification Theorems and Linear-Quadratic Applications
この論文は、2 人のプレイヤーによるエルゴード的 McKean-Vlasov 確率微分ゲームを研究し、Master 方程式の解とナッシュ均衡を結びつける検証定理を確立するとともに、線形二次ガウス(LQG)設定における明示的な解を導出するものである。
338 件の論文
この論文は、2 人のプレイヤーによるエルゴード的 McKean-Vlasov 確率微分ゲームを研究し、Master 方程式の解とナッシュ均衡を結びつける検証定理を確立するとともに、線形二次ガウス(LQG)設定における明示的な解を導出するものである。
この論文は、埋め込みリアルタイム最適化(特に誘導・制御分野)向けに、問題の再定式化を不要とし、スパース性を維持しながら非現実性を検出できるカスタマイズ型第二次円錐計画法ソルバーと、そのコード生成ツールを開発し、組込みプラットフォーム上でのベンチマークにより既存ソルバーを上回る性能を実証したものである。
本論文は、Bredies らが提案したグラフ分割法の不動点に関する一般論を展開し、特に閉線形部分空間の法錐として定義される最大単調作用素の場合に収束点の明示的な式を導出することで、既存結果の統合と新たな知見の獲得を実現しています。
本論文は、テンソルの特定のモードに沿ったファイバーが完全に観測されているか欠損しているという「ファイバーごとの観測」パターンに特化した、標準的な線形代数演算に基づく高速かつ確定的なテンソル・トレイン分解による補完手法を提案し、その有効性を示しています。
この論文は、関数エンコーダ方策を用いたニューラル基底関数の事前学習とオンラインでの軽量係数推定により、目的関数が変化するパラメータ最適制御問題に対して、従来の最適化手法に比べて計算コストを大幅に削減しつつ、ほぼ最適な性能でゼロショット適応を可能にする転移可能な解法を提案しています。
この論文は、通信ネットワークにおける時間遅延やパケット損失などの不安定な動的変化に対して、Zames-Falb フィルタ係数と線形行列不等式を用いて指数収束率が保証された離散時間最適化アルゴリズムの解析と設計手法を提案し、その有効性を示すものである。
本論文は、境界値追跡を目的とした楕円型偏微分方程式の最適制御問題に対し、状態変数に基づく変分定式化を用いてテンソル積有限要素法を適用し、最適な離散化誤差評価と高速ソルバーの導出、および数値実験による理論的結果の検証を行うことを述べています。
この論文は、拡散項が状態や制御変数に依存するリーダー・フォロワー型線形二次確率グラフオンゲームの枠組みを構築し、フォロワー間のナッシュ均衡とリーダーの最適化を統合したスタッケルバーグ・ナッシュ均衡の存在・一意性および安定性を証明するものです。
この論文は、確率的変分不等式における「確率性バリア」を打破し、STORM 法と同一バッチ曲率検証を統合した新しいアルゴリズム「VR-SDA-A」を提案することで、非凸非凹最適化問題において最適なオラクル複雑度 O(ε⁻³) を達成しつつ、手動学習率調整なしで自動ステップサイズ適応を可能にする手法を確立したものである。
この論文は、交換可能な確率変数の和に対するホエフディング型の集中不等式を確立し、i.i.d. 設定の一般化として、尾部確率の反対称性を示し、特に混合測度の支持域における最大(または最小)の平均に基づいた上側(または下側)の尾部評価を提供することで、有限サンプルと集団平均の間のギャップを埋めることを主張しています。
本論文は、確率的な目的関数と決定論的な非線形制約条件を持つ最適化問題に対して、適応的な精度条件を満たす確率的オラクルと内点法を組み合わせた新しい「TR-IP-SSQP」手法を提案し、その第一-order 停留点への大域的な収束性を理論的に証明するとともに、CUTEst テストセットやロジスティック回帰問題への適用を通じて実用性を示したものである。
この論文は、制御理論の観点からソーシャルネットワーク上の推薦システムを設計し、エンゲージメントの最大化と分極化の抑制を両立させる安定した制御則を導出するとともに、過度なエンゲージメント重視がシステム不安定化を招くリスクを明らかにしています。
この論文は、分布ロバスト制御における半無限計画問題(SIP)の回避を可能にする新たな手法を提案し、特定の分布距離に基づくペナルティ項を導入することで、離散時間割引最適制御問題を平均・分散最小化問題に再定式化し、線形二次レギュレータ設定ではリカッチ方程式を解くことで制御則を得られることを示しています。
本論文は、有限マルコフ連鎖の混合を加速する最適な 2 ブロック分割を選択する問題に対し、KL 発散とフロベニウス距離という 2 つの基準に基づいて最適化手法を確立し、組合せ最適化問題として定式化するとともに、効率的な近似アルゴリズムを提案してその実用性を検証したものである。
この論文は、エントロピー正則化を駆使して時間一貫性のない確率制御問題における均衡の存在を証明し、正則化された探索的均衡 HJB 方程式の古典解が正則化パラメータの消失とともに元の問題の均衡(一般化された HJB 方程式の弱解)に収束することを示すことで、従来の強い正則性仮定を必要としない新たな存在理論を確立した。
本論文は、三角行列や新たに定義された二対角南西行列などの帯行列の線形相補性(Q 性)を符号パターンや行列式を用いて特徴づけ、さらにユークリッド・ジョルダン代数におけるランク 1 線形写像の Q 性条件を明らかにするものである。
この論文は、初期値に依存せず大域的に収束する単調なヘッシアン・リーマン流を提案して順問題の課題を解決し、さらに逆問題に対して順ソルバの実装詳細に依存しないソルバ非依存フレームワークを構築することで、時間依存平均場ゲームの順問題と逆問題の両方の課題に対処しています。
この論文は、LLM によるバイアス付き評価と高コストな人間による監査を組み合わせ、逆確率重み付け残差を用いた推定器と PP-LUCB アルゴリズムを開発することで、テキスト証拠に基づくサービスシステムの最適構成を低コストかつ高信頼性で特定する手法を提案し、その有効性を理論的・実験的に証明したものである。
この論文は、スケーリングされたジョルダン枠を持つ双曲系において、多項式とその導多項式が最小多項式となることを示し、ジョルダン枠の直交性やシュール型の主要化結果を導出するものである。
本論文は、外半連続かつ局所コンパクトな集合値写像において、半局所的なリプシッツ上半連続性モジュラスが局所的な冷静性モジュラスの上限と等しくなるという一般的な位相的条件を確立し、非凸な最適化問題などにおける半局所的な誤差 bound の精密な計算を可能にすることを示しています。