cs.MA papers | Gist.Science

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

Deze paper introduceert CoHet, een algoritme dat graph neural networks gebruikt om intrinsieke beloningen te genereren en zo de samenwerking tussen heterogene agents in gedecentraliseerde multi-agent versterkingsleer te verbeteren, zelfs bij gedeeltelijke waarneembaarheid en schaarse beloningen.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Dit paper introduceert een datagedreven aanpak op basis van differentieerbare optimalisatie en controle-barrièrefuncties om verantwoordelijkheidsallocaties voor veilige multi-agent-interacties te leren, waardoor een interpreteerbaar inzicht wordt verkregen in hoe agenten hun gedrag aanpassen om de veiligheid van anderen te waarborgen.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Characterizations of voting rules based on majority margins

Dit artikel karakteriseert stemregels die gebaseerd zijn op meerderheidsmarges door te bewijzen dat ze equivalent zijn aan regels die voldoen aan axioma's met een duidelijkere normatieve inhoud, zoals het principe van Preferentiële Gelijkheid.

Yifeng Ding, Wesley H. Holliday, Eric PacuitWed, 11 Ma📈 econ

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

Dit paper introduceert GateLens, een LLM-agent die Relational Algebra gebruikt als formele tussenlaag om complexe tabulaire data in de automobielindustrie snel, transparant en betrouwbaar te analyseren, waardoor de analysetijd met meer dan 80% wordt gereduceerd ten opzichte van bestaande methoden.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Dit paper introduceert CORA, een methode voor credit assignment in multi-agent reinforcement learning die gebruikmaakt van coöperatieve speltheorie en kernallocatie om agenten effectiever te belonen op basis van hun coalitiële bijdragen, wat leidt tot verbeterde gecoördineerde prestaties.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents

Dit artikel introduceert CMASE, een raamwerk voor computationele multi-agent-samenlevingsexperimenten dat generatieve agentmodellen combineert met virtuele etnografie om onderzoekers in staat te stellen zich als geïntegreerde deelnemers te begeven in virtuele sociale omgevingen voor causaal onderbouwde interventiemodellering.

Hanzhong Zhang, Muhua Huang, Jindong WangWed, 11 Ma🤖 cs.AI

Personalized Collaborative Learning with Affinity-Based Variance Reduction

Dit paper introduceert AffPCL, een nieuw raamwerk voor gepersonaliseerd collaboratief leren dat heterogene agenten in staat stelt om hun sample complexiteit te reduceren door een adaptieve, affiniteitsgebaseerde variance-reductie die naadloos varieert tussen lineaire versnelling bij homogeniteit en onafhankelijk leren bij hoge heterogeniteit.

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

Polynomial-time Configuration Generator for Connected Unlabeled Multi-Agent Pathfinding

Dit artikel introduceert PULL, een lichtgewicht en volledig algoritme dat in polynomiale tijd verbinding behoudt voor ongelabelde multi-agent padvinding (CUMAPF) en hiermee de schaalbaarheidsproblemen van bestaande ILP-methoden oplost voor zwermrobotica-toepassingen.

Takahiro Suzuki, Keisuke OkumuraWed, 11 Ma💻 cs

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Deze paper introduceert een robuust multi-agent reinforcement learning-framework dat communicatiebeperkingen als leerprioriteit gebruikt om de impact van verliesvolle en verliesvrije berichten op gedecentraliseerde besluitvorming te kwantificeren en te optimaliseren in complexe, dynamische omgevingen.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Dit artikel introduceert een meta-spelontwerp om algoritmische collusie te evalueren onder test-tijdbeperkingen, waarbij wordt onderzocht hoe agents met vooraf getrainde beleidsregels en aanpassingsmechanismen in herhaalde prijsbepalingssituaties kunnen evolueren naar samenwerking of concurrentie.

Yuhong Luo, Daniel Schoepflin, Xintong WangWed, 11 Ma💻 cs

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Dit paper introduceert Coordinated Boltzmann MCTS (CB-MCTS), een nieuwe methode die deterministische UCT vervangt door een stochastisch Boltzmann-beleid met een vervagende entropiebonus om Dec-MCTS robuuster te maken in omgevingen met schaarse of scheef verdeelde beloningen.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

Dit paper introduceert ChatNeuroSim, een framework op basis van een groot taalmodel dat het ontwerp, de implementatie en de optimalisatie van Compute-in-Memory-versnellers voor diepe neurale netwerken volledig automatiseert en versnelt door gebruik te maken van een geautomatiseerde agent en een techniek voor het afkappen van de ontwerpruimte.

Ming-Yen Lee, Shimeng YuWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Dit artikel introduceert \texttt{electoral\_sim}, een open-source Python-framework dat verschillende kiesstelsels simuleert en vergelijkt op basis van hun nauwkeurigheid bij het vertegenwoordigen van de geometrische mediaan van kiezersvoorkeuren in diverse ideologische scenario's.

Sumit MukherjeeWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

Het artikel introduceert Scale-Plan, een schaalbaar raamwerk dat grote taalmodellen combineert met gestructureerde grafzoekalgoritmen om irrelevante informatie te filteren en zo betrouwbare, langdurige taakplanning voor heterogene multi-robotteams mogelijk te maken, wat wordt gevalideerd met de nieuwe MAT2-THOR-benchmark.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

Dit paper introduceert LDP, een identiteitsbewust protocol voor multi-agent LLM-systemen dat modelkenmerken als eerste klas-bouwstenen gebruikt om efficiëntere, beter bestuurde en veiligere delegatie mogelijk te maken.

Sunil PrakashWed, 11 Ma🤖 cs.AI

Latent World Models for Automated Driving: A Unified Taxonomy, Evaluation Framework, and Open Challenges

Dit artikel introduceert een unificerend raamwerk voor latente wereldmodellen in geautomatiseerd rijden dat een gestructureerde taxonomie, een evaluatiekader en toekomstige uitdagingen biedt om de overgang van open-lus naar gesloten-lus prestaties te verbeteren.

Rongxiang Zeng, Yongqi DongWed, 11 Ma🤖 cs.AI

Chaotic Dynamics in Multi-LLM Deliberation

Dit onderzoek toont aan dat multi-LLM-deliberatiesystemen, zelfs onder omstandigheden die als deterministisch worden beschouwd, gevoelig kunnen zijn voor chaotische dynamiek en instabiliteit veroorzaakt door rolverschillen en modelheterogeniteit, wat onderstreept dat stabiliteitsaudits essentieel zijn voor het ontwerp van dergelijke bestuursystemen.

Hajime Shimao, Warut Khern-am-nuai, Sung Joo KimWed, 11 Ma🤖 cs.AI

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

Het paper introduceert AgenticCyOps, een raamwerk dat de beveiliging van multi-agent AI-systemen in enterprise-cyberoperaties verbetert door aanvalsoppervlakken te analyseren en vijf defensieve principes toe te passen om de exploitatie van vertrouwensgrenzen aanzienlijk te verminderen.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Deze paper introduceert \texttt{RQRE-OVI}, een nieuw algoritme dat Risk-Sensitive Quantal Response Equilibrium (RQRE) berekent in grote Markov-games met lineaire functiebenadering, waardoor een unieke en stabiele oplossing wordt gevonden die een waardevolle afweging biedt tussen prestatie en robuustheid ten opzichte van traditionele Nash-evenwichten.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

ToolRosetta is een geautomatiseerd framework dat open-source code repositories en API's omzet in MCP-compatibele tools, waardoor LLM-agenten complexe taken kunnen uitvoeren met minimale menselijke tussenkomst en verbeterde prestaties.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs