cs.MA articles | Gist.Science

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

Cet article présente CoHet, un algorithme de reinforcement learning multi-agents décentralisé qui utilise une motivation intrinsèque pilotée par des réseaux de neurones graphiques pour améliorer la coopération entre agents hétérogènes dans des environnements à observabilité partielle et à récompenses rares.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Cet article propose une approche d'optimisation différentiable basée sur les fonctions de barrière de contrôle pour apprendre de manière interprétable, à partir de données, comment les agents multi-agents allouent leur responsabilité afin d'assurer des interactions sûres et efficaces.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Characterizations of voting rules based on majority margins

Cet article établit que les règles de vote basées sur les marges majoritaires sont caractérisées par un ensemble d'axiomes à contenu normatif clair, notamment le principe d'égalité préférentielle qui garantit un traitement équitable des préférences individuelles entre candidats.

Yifeng Ding, Wesley H. Holliday, Eric PacuitWed, 11 Ma📈 econ

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

Le papier présente GateLens, un agent LLM innovant qui utilise l'algèbre relationnelle comme représentation intermédiaire formelle pour améliorer la fiabilité et l'efficacité de l'analyse de données tabulaires complexes dans le secteur automobile, surpassant les approches traditionnelles tout en réduisant considérablement le temps d'analyse.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Cette présentation propose CORA, une méthode d'attribution de crédit pour l'apprentissage par renforcement multi-agent coopératif qui utilise l'allocation du noyau de la théorie des jeux coopératifs et l'échantillonnage aléatoire de coalitions pour optimiser l'apprentissage des politiques en attribuant les avantages globaux aux stratégies de coalition.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents

Ce papier présente CMASE, un cadre d'expérimentation pour les sociétés multi-agents computationnelles qui intègre des agents génératifs et des méthodes ethnographiques virtuelles pour permettre aux chercheurs de s'immerger dans des environnements sociaux simulés afin d'étudier, d'interpréter et d'intervenir sur des phénomènes sociaux complexes avec une rigueur causale et une précision empirique.

Hanzhong Zhang, Muhua Huang, Jindong WangWed, 11 Ma🤖 cs.AI

Personalized Collaborative Learning with Affinity-Based Variance Reduction

Cet article propose AffPCL, un cadre d'apprentissage collaboratif personnalisé qui réduit la complexité d'échantillonnage grâce à des mécanismes de correction de biais et d'importance, permettant une accélération adaptative basée sur l'affinité entre agents sans nécessiter de connaissances préalables sur leur hétérogénéité.

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

Polynomial-time Configuration Generator for Connected Unlabeled Multi-Agent Pathfinding

Cet article présente PULL, un algorithme complet et léger fonctionnant en temps polynomial qui résout efficacement le problème de recherche de chemin multi-agent connecté et non étiqueté (CUMAPF) pour des essaims de robots, surpassant les méthodes d'optimisation par programmation linéaire en entier en termes d'évolutivité.

Takahiro Suzuki, Keisuke OkumuraWed, 11 Ma💻 cs

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Cet article propose un cadre d'apprentissage par renforcement multi-agent généralisé qui utilise des priors contraints par la communication et un estimateur d'information mutuelle dual pour distinguer les messages perdus des messages intacts, afin d'améliorer la robustesse et l'évolutivité des politiques coopératives dans des environnements réels complexes.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Cet article propose un méta-jeu conçu pour évaluer l'émergence de la collusion algorithmique lors de la phase de test, en modélisant des agents avec des politiques préentraînées et des règles d'adaptation pour analyser leurs interactions stratégiques dans des jeux de prix répétés.

Yuhong Luo, Daniel Schoepflin, Xintong WangWed, 11 Ma💻 cs

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Cet article présente le CB-MCTS, une méthode de recherche arborescente Monte Carlo décentralisée qui remplace la politique UCT déterministe par une politique stochastique de Boltzmann avec un bonus d'entropie décroissant, permettant ainsi une exploration plus robuste et performante dans des environnements multi-agents à récompenses clairsemées ou trompeuses.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

Ce papier présente ChatNeuroSim, un cadre d'agents basé sur les grands modèles de langage qui automatise le déploiement et l'optimisation des accélérateurs de mémoire calculante (CIM) en intégrant un élagage de l'espace de conception pour réduire considérablement le temps de cycle de recherche et d'exploration.

Ming-Yen Lee, Shimeng YuWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Cet article présente \texttt{electoral\_sim}, un cadre open-source en Python qui simule et compare la performance de divers systèmes électoraux, y compris un mécanisme hypothétique basé sur un noyau softmax de Boltzmann, en mesurant leur capacité à se rapprocher de la médiane géométrique des électeurs à travers des distributions de préférences variées.

Sumit MukherjeeWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

Le papier présente Scale-Plan, un cadre évolutif assisté par les grands modèles de langage qui génère des représentations de problèmes compactes et pertinentes pour surmonter les défis de la planification à long terme dans les systèmes multi-robots hétérogènes, tout en introduisant le benchmark MAT2-THOR pour évaluer ces systèmes avec fiabilité.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

Ce papier présente le LLM Delegate Protocol (LDP), un protocole de communication natif pour l'IA qui introduit des mécanismes d'identité et de gouvernance pour optimiser la délégation entre agents, démontrant par une implémentation et des évaluations des gains significatifs en latence et en efficacité des tokens, bien que la métadonnée de confiance sans vérification puisse nuire à la qualité.

Sunil PrakashWed, 11 Ma🤖 cs.AI

Latent World Models for Automated Driving: A Unified Taxonomy, Evaluation Framework, and Open Challenges

Cet article propose un cadre unifié pour les modèles de monde latents en conduite automatisée, établissant une taxonomie, des mécanismes internes et des protocoles d'évaluation pour améliorer la robustesse, la généralisation et l'efficacité des systèmes de décision.

Rongxiang Zeng, Yongqi DongWed, 11 Ma🤖 cs.AI

Chaotic Dynamics in Multi-LLM Deliberation

Cette étude modélise les comités d'IA multi-LLM comme des systèmes dynamiques aléatoires et démontre que la différenciation des rôles et l'hétérogénéité des modèles provoquent une instabilité chaotique imprévue, même dans des régimes supposés déterministes, soulignant ainsi la nécessité d'audits de stabilité pour les systèmes de gouvernance collective.

Hajime Shimao, Warut Khern-am-nuai, Sung Joo KimWed, 11 Ma🤖 cs.AI

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

Le papier présente AgenticCyOps, un cadre de sécurité architectural qui définit des principes de défense pour sécuriser l'intégration des systèmes multi-agents dans les opérations cybernétiques d'entreprise en réduisant les surfaces d'attaque et en s'alignant sur les normes de conformité.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Cet article propose l'algorithme \texttt{RQRE-OVI}, une méthode d'apprentissage par renforcement multi-agent avec approximation linéaire qui calcule un équilibre de réponse quantale sensible au risque, offrant ainsi une solution unique, stable et robuste avec des garanties de convergence et un compromis contrôlé entre performance et résilience.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

Le papier présente ToolRosetta, un cadre unifié qui automatise la conversion de dépôts de code open-source en outils MCP standardisés pour permettre aux agents d'IA d'exécuter des tâches complexes avec une intervention humaine minimale, tout en intégrant une couche de sécurité et en surpassant les performances des modèles commerciaux.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs