Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

この論文は、部分的観測性と報酬の希薄性という課題に直面する分散型マルチエージェント強化学習において、異種エージェント間の協調を促進するために、グラフニューラルネットワークを活用した新しい内在的報酬メカニズム「CoHet」を提案し、複数のベンチマークで最先端の手法を上回る性能を実証したものである。

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

この論文は、制御バリア関数と微分可能最適化を用いたデータ駆動型アプローチを提案し、自律走行や配送などのマルチエージェント相互作用において、他者の安全を確保するためにエージェントが自身の制御をどの程度調整するか(責任配分)を学習・定量化する手法を提示しています。

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

本論文は、自然言語と実行可能コードの間の推論ギャップを解決し、自動車ソフトウェアリリース分析において既存手法を上回る精度と高速性を達成する、関係代数を中間表現として活用した新しい LLM エージェント「GateLens」を提案し、その有効性を実証したものである。

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

本論文は、協力型マルチエージェント強化学習におけるクレジット割り当て問題に対し、協力ゲーム理論の「コア」に基づく利得配分手法 CORA を提案し、エージェント間の連合貢献を適切に評価することで協調的な最適行動を促進し、既存手法を上回る性能を実現することを示しています。

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents

この論文は、生成エージェントと仮想民族誌的手法を統合し、研究者を外部操作者から没入型参加者へと転換させることで、複雑な社会現象のシミュレーションと因果的な介入分析を可能にする計算的多エージェント社会実験フレームワーク「CMASE」を提案しています。

Hanzhong Zhang, Muhua Huang, Jindong WangWed, 11 Ma🤖 cs.AI

Personalized Collaborative Learning with Affinity-Based Variance Reduction

この論文は、エージェント間の異質性レベルを事前に知らずに、環境や目的関数の多様性に応じて協調学習の利点を自動的に調整し、独立学習に対して最大で線形加速を実現する新しいパーソナライズド協調学習フレームワーク「AffPCL」を提案し、その理論的保証を示すものである。

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

Polynomial-time Configuration Generator for Connected Unlabeled Multi-Agent Pathfinding

この論文は、スウォームロボティクスにおける連結性制約を満たすマルチエージェント経路計画問題(CUMAPF)に対し、スケーラビリティに課題がある整数線形計画法に代わり、連結性を維持しつつ目標へ近づくルールベースの完全アルゴリズム「PULL」を提案し、数百エージェント規模のインスタンスを高速に解決可能であることを示しています。

Takahiro Suzuki, Keisuke OkumuraWed, 11 Ma💻 cs

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

この論文は、現実世界の通信制約下での協調学習の課題に対処するため、通信条件を統一的に記述する一般化モデルを学習の事前分布として活用し、損失あり・なしのメッセージの影響を双方向相互情報量推定器を用いて分離・定量化する新たなマルチエージェント強化学習フレームワークを提案し、その有効性を検証したものである。

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

この論文は、疎な報酬環境や欺瞞的なシナリオにおいて従来の分散モンテカルロ木探索(Dec-MCTS)よりも優れた性能を発揮するよう、確率的なボルツマン方策と減衰エントロピーボーナスを導入した協調ボルツマン MCTS(CB-MCTS)を提案し、その有効性をシミュレーションで実証したものである。

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

本論文は、計算内蔵メモリ(CIM)アクセラレータの設計空間探索を自動化し、大規模言語モデル(LLM)エージェントと設計空間剪定技術を用いてシミュレーションから最適化までのワークフローを効率化し、DNN ワークロードに対する最適構成の迅速な特定を可能にする「ChatNeuroSim」というフレームワークを提案するものである。

Ming-Yen Lee, Shimeng YuWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

本論文は、有権者の分布シナリオに基づいて複数の選挙制度をシミュレーションし、その結果と有権者分布の幾何学的中央値との距離を評価するオープンソースの Python フレームワーク「electoral_sim」を提案し、既存の制度から理論的な上限性能を示す仮想的な新方式までを比較検証したものである。

Sumit MukherjeeWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

本論文は、大規模言語モデル(LLM)と記号プランナーを組み合わせ、環境からタスクに関連する情報のみを抽出して計画の複雑さを軽減する「Scale-Plan」フレームワークと、その評価用の新ベンチマーク「MAT2-THOR」を提案し、異種多ロボットチームにおける長期的タスク計画の拡張性と信頼性を向上させたものである。

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

この論文は、モデルのアイデンティティや推論プロファイルなどを第一級プリミティブとして取り込み、効率的かつ管理可能なマルチエージェント LLM システムの実現を目指す新しい通信プロトコル「LLM Delegate Protocol (LDP)」を提案し、その実装と評価を通じて、アイデンティティ感知型ルーティングによる遅延削減や構造化ペイロードによるトークン効率の向上などの実証的利点を示しています。

Sunil PrakashWed, 11 Ma🤖 cs.AI

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

本論文は、LLM 駆動のマルチエージェントシステムが企業環境に導入される際に生じる新たな攻撃面を特定し、ツール編成とメモリ管理を主要な信頼境界として定義する「AgenticCyOps」フレームワークを提案し、SOC ワークフローへの適用を通じて攻撃経路の大部分を遮断し、信頼境界を 72% 以上削減する効果を実証しています。

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

本論文は、大規模なマルコフゲームにおいて、ナッシュ均衡の欠点を克服し、推定報酬に対するリプシッツ連続性と分布ロバスト性を備えた「リスク感受性量化応答均衡(RQRE)」を線形関数近似を用いて効率的に計算するアルゴリズム「RQRE-OVI」を提案し、その収束性と頑健性の理論的保証および実験的有効性を示したものである。

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

本論文は、大規模言語モデルエージェントがオープンソースのコードリポジトリを自動的に標準化された実行可能ツールに変換し、人間の介入を最小限に抑えて安全にタスクを完了させるための統合フレームワーク「ToolRosetta」を提案するものである。

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs