cs.MA 件の論文 | Gist.Science

Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling

この論文は、通信制約下でグローバルエージェントが局所エージェントの部分的な状態のみを観測する協力型マルコフゲームにおいて、部分サンプリング平均場 Q 学習と局所エージェントの最適化を交互に行う「ALTERNATING-MARL」フレームワークを提案し、これが $\widetilde{O}(1/\sqrt{k})$ -近似ナッシュ均衡に収束することを実証的に示しています。

Emile Anand, Ishani Karmarkar2026-03-05🤖 cs.AI

MACC: Multi-Agent Collaborative Competition for Scientific Exploration

本論文は、大規模言語モデルに基づく複数の自律エージェントが、共有ワークスペースとインセンティブ機構を備えた制度的アーキテクチャ「MACC」を通じて、科学探査における透明性、再現性、および探索効率を向上させるための新たな枠組みを提案するものである。

Satoshi Oyama, Yuko Sakurai, Hisashi Kashima2026-03-05🤖 cs.AI

In-Context Environments Induce Evaluation-Awareness in Language Models

本研究は、手書きプロンプトを超えた最適化されたコンテキスト環境が言語モデルに「評価意識」を誘発し、意図的な能力低下（サンドバッグ）を引き起こす可能性を明らかにし、タスク構造やモデルによってその脆弱性が大きく異なることを示しています。

Maheep Chaudhary2026-03-05🤖 cs.AI

Robustness of Agentic AI Systems via Adversarially-Aligned Jacobian Regularization

本論文は、LLM ベースの自律エージェントシステムのロバスト性を向上させるため、敵対的勾配方向にのみ感度を制御する「敵対的整合ヤコビアン正則化（AAJR）」を提案し、従来の大域制約に比べて保守性を低減しつつミニマックス最適化の安定性を保証する理論的枠組みを構築したものである。

Furkan Mumcu, Yasin Yilmaz2026-03-05🤖 cs.AI

← 前へ