Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling

この論文は、通信制約下でグローバルエージェントが局所エージェントの部分的な状態のみを観測する協力型マルコフゲームにおいて、部分サンプリング平均場 Q 学習と局所エージェントの最適化を交互に行う「ALTERNATING-MARL」フレームワークを提案し、これが O~(1/k)\widetilde{O}(1/\sqrt{k})-近似ナッシュ均衡に収束することを実証的に示しています。

Emile Anand, Ishani Karmarkar2026-03-05🤖 cs.AI

Robustness of Agentic AI Systems via Adversarially-Aligned Jacobian Regularization

本論文は、LLM ベースの自律エージェントシステムのロバスト性を向上させるため、敵対的勾配方向にのみ感度を制御する「敵対的整合ヤコビアン正則化(AAJR)」を提案し、従来の大域制約に比べて保守性を低減しつつミニマックス最適化の安定性を保証する理論的枠組みを構築したものである。

Furkan Mumcu, Yasin Yilmaz2026-03-05🤖 cs.AI