Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

Cet article présente CoHet, un algorithme de reinforcement learning multi-agents décentralisé qui utilise une motivation intrinsèque pilotée par des réseaux de neurones graphiques pour améliorer la coopération entre agents hétérogènes dans des environnements à observabilité partielle et à récompenses rares.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

Le papier présente GateLens, un agent LLM innovant qui utilise l'algèbre relationnelle comme représentation intermédiaire formelle pour améliorer la fiabilité et l'efficacité de l'analyse de données tabulaires complexes dans le secteur automobile, surpassant les approches traditionnelles tout en réduisant considérablement le temps d'analyse.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Cette présentation propose CORA, une méthode d'attribution de crédit pour l'apprentissage par renforcement multi-agent coopératif qui utilise l'allocation du noyau de la théorie des jeux coopératifs et l'échantillonnage aléatoire de coalitions pour optimiser l'apprentissage des politiques en attribuant les avantages globaux aux stratégies de coalition.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents

Ce papier présente CMASE, un cadre d'expérimentation pour les sociétés multi-agents computationnelles qui intègre des agents génératifs et des méthodes ethnographiques virtuelles pour permettre aux chercheurs de s'immerger dans des environnements sociaux simulés afin d'étudier, d'interpréter et d'intervenir sur des phénomènes sociaux complexes avec une rigueur causale et une précision empirique.

Hanzhong Zhang, Muhua Huang, Jindong WangWed, 11 Ma🤖 cs.AI

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Cet article propose un cadre d'apprentissage par renforcement multi-agent généralisé qui utilise des priors contraints par la communication et un estimateur d'information mutuelle dual pour distinguer les messages perdus des messages intacts, afin d'améliorer la robustesse et l'évolutivité des politiques coopératives dans des environnements réels complexes.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Cet article présente le CB-MCTS, une méthode de recherche arborescente Monte Carlo décentralisée qui remplace la politique UCT déterministe par une politique stochastique de Boltzmann avec un bonus d'entropie décroissant, permettant ainsi une exploration plus robuste et performante dans des environnements multi-agents à récompenses clairsemées ou trompeuses.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Cet article présente \texttt{electoral\_sim}, un cadre open-source en Python qui simule et compare la performance de divers systèmes électoraux, y compris un mécanisme hypothétique basé sur un noyau softmax de Boltzmann, en mesurant leur capacité à se rapprocher de la médiane géométrique des électeurs à travers des distributions de préférences variées.

Sumit MukherjeeWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

Le papier présente Scale-Plan, un cadre évolutif assisté par les grands modèles de langage qui génère des représentations de problèmes compactes et pertinentes pour surmonter les défis de la planification à long terme dans les systèmes multi-robots hétérogènes, tout en introduisant le benchmark MAT2-THOR pour évaluer ces systèmes avec fiabilité.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

Ce papier présente le LLM Delegate Protocol (LDP), un protocole de communication natif pour l'IA qui introduit des mécanismes d'identité et de gouvernance pour optimiser la délégation entre agents, démontrant par une implémentation et des évaluations des gains significatifs en latence et en efficacité des tokens, bien que la métadonnée de confiance sans vérification puisse nuire à la qualité.

Sunil PrakashWed, 11 Ma🤖 cs.AI

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Cet article propose l'algorithme \texttt{RQRE-OVI}, une méthode d'apprentissage par renforcement multi-agent avec approximation linéaire qui calcule un équilibre de réponse quantale sensible au risque, offrant ainsi une solution unique, stable et robuste avec des garanties de convergence et un compromis contrôlé entre performance et résilience.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

Le papier présente ToolRosetta, un cadre unifié qui automatise la conversion de dépôts de code open-source en outils MCP standardisés pour permettre aux agents d'IA d'exécuter des tâches complexes avec une intervention humaine minimale, tout en intégrant une couche de sécurité et en surpassant les performances des modèles commerciaux.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs