cs.MA articoli | Gist.Science

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

Il paper propone CoHet, un algoritmo di apprendimento per rinforzo multi-agente decentralizzato che utilizza una ricompensa intrinseca basata su Reti Neurali su Grafi per migliorare la cooperazione tra agenti eterogenei in ambienti con osservabilità parziale e segnali di reward radi, ottenendo prestazioni superiori rispetto allo stato dell'arte.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Questo lavoro propone un approccio basato su funzioni di barriera di controllo e ottimizzazione differenziabile per apprendere in modo efficiente e interpretabile le allocazioni di responsabilità degli agenti nelle interazioni multi-agente, permettendo di codificare fattori sociali e contestuali per garantire interazioni sicure ed efficienti.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Characterizations of voting rules based on majority margins

Questo articolo dimostra che le regole di voto basate sui margini di maggioranza sono caratterizzate da assiomi normativi più chiari, in particolare il principio di "uguaglianza preferenziale", che garantisce un trattamento equo delle preferenze reciproche tra gli elettori.

Yifeng Ding, Wesley H. Holliday, Eric PacuitWed, 11 Ma📈 econ

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

Il paper introduce GateLens, un agente LLM che utilizza l'Algebra Relazionale come rappresentazione intermedia formale per garantire analisi rapide, trasparenti e affidabili di dati tabulari complessi nel settore automobilistico, superando i limiti dei sistemi basati su Chain-of-Thought e riducendo i tempi di analisi dell'80% senza necessità di esempi few-shot.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Il lavoro propone CORA, un metodo di assegnazione del credito per l'apprendimento per rinforzo multi-agente cooperativo che utilizza il nucleo della teoria dei giochi cooperativi e il campionamento casuale delle coalizioni per allocare in modo più efficace i vantaggi globali e promuovere comportamenti coordinati ottimali.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents

Il paper introduce CMASE, un framework per esperimenti computazionali di società multi-agente che integra agenti generativi ed etnografia virtuale per trasformare i ricercatori in partecipanti embedded, consentendo di simulare fenomeni sociali complessi con rigore statistico e profondità interpretativa.

Hanzhong Zhang, Muhua Huang, Jindong WangWed, 11 Ma🤖 cs.AI

Personalized Collaborative Learning with Affinity-Based Variance Reduction

Il paper propone AffPCL, un framework di apprendimento collaborativo personalizzato che riduce la complessità dei campioni adattandosi automaticamente all'eterogeneità degli agenti tramite meccanismi di correzione, garantendo un'accelerazione basata sull'affinità senza richiedere conoscenze a priori del sistema.

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

Polynomial-time Configuration Generator for Connected Unlabeled Multi-Agent Pathfinding

Questo articolo presenta PULL, un algoritmo completo e polinomiale che risolve in modo efficiente il problema della ricerca di percorsi multi-agente sconnessi e connessi (CUMAPF) per sciami robotici, superando i limiti di scalabilità delle formulazioni di programmazione lineare intera.

Takahiro Suzuki, Keisuke OkumuraWed, 11 Ma💻 cs

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Il paper propone un nuovo framework di apprendimento per rinforzo multi-agente che utilizza un modello generalizzato vincolato alle comunicazioni come prior di apprendimento per distinguere tra messaggi persi e integri, disaccoppiandone l'impatto decisionale e quantificandolo nella ricompensa globale per migliorare la cooperazione in scenari reali complessi.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Questo articolo introduce un design di meta-gioco per analizzare il rischio di collusione algoritmica in scenari di test-time, valutando come agenti con politiche pre-addestrate e diverse regole di adattamento possano evolvere verso la cooperazione o la competizione in giochi di pricing ripetuti.

Yuhong Luo, Daniel Schoepflin, Xintong WangWed, 11 Ma💻 cs

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Il paper presenta il Coordinated Boltzmann MCTS (CB-MCTS), un nuovo approccio decentralizzato che sostituisce la politica UCT deterministica con una strategia stocastica basata su Boltzmann e un bonus di entropia decrescente, risultando superiore al Dec-MCTS tradizionale in scenari ingannevoli e a ricompensa scarsa.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

Il paper presenta ChatNeuroSim, un framework basato su agenti LLM che automatizza il deployment e l'ottimizzazione degli acceleratori Compute-in-Memory, riducendo significativamente il tempo necessario per l'esplorazione dello spazio di progettazione e l'identificazione delle configurazioni ottimali per carichi di lavoro DNN.

Ming-Yen Lee, Shimeng YuWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Il paper presenta \texttt{electoral\_sim}, un framework open-source in Python che simula e confronta diversi sistemi elettorali in scenari di distribuzione degli elettori, valutandoli in base alla loro capacità di avvicinarsi alla mediana geometrica della distribuzione e includendo un meccanismo ipotetico basato su un kernel softmax di Boltzmann come limite teorico superiore.

Sumit MukherjeeWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

Il paper presenta Scale-Plan, un framework scalabile che combina modelli linguistici e pianificazione simbolica per generare rappresentazioni compatte di compiti multi-robot eterogenei, superando le limitazioni di allucinazione e scalabilità degli approcci esistenti attraverso la filtrazione delle informazioni irrilevanti e la validazione su un nuovo benchmark MAT2-THOR.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

Il documento presenta il LLM Delegate Protocol (LDP), un protocollo di comunicazione nativo per l'intelligenza artificiale che introduce identità dei modelli, tracciamento della provenienza e sessioni governate per abilitare una delega più efficiente e controllabile nei sistemi multi-agente, dimostrando attraverso un'implementazione su JamJet significativi miglioramenti nella latenza e nell'efficienza dei token, sebbene con risultati contrastanti sulla qualità complessiva e la necessità di verifica per i metadati di fiducia.

Sunil PrakashWed, 11 Ma🤖 cs.AI

Latent World Models for Automated Driving: A Unified Taxonomy, Evaluation Framework, and Open Challenges

Questo articolo propone un quadro unificato per i modelli di mondo latenti nella guida automatizzata, presentando una tassonomia che organizza le rappresentazioni latenti, delineando cinque meccanismi interni fondamentali, introducendo un framework di valutazione per colmare il divario tra scenari open-loop e closed-loop e identificando le sfide aperte per sistemi decisionali verificabili ed efficienti.

Rongxiang Zeng, Yongqi DongWed, 11 Ma🤖 cs.AI

Chaotic Dynamics in Multi-LLM Deliberation

Lo studio dimostra che i sistemi deliberativi multi-LLM, anche in condizioni deterministiche, possono esibire dinamiche caotiche e instabilità imprevedibili a causa della differenziazione dei ruoli e dell'eterogeneità dei modelli, rendendo essenziale l'audit di stabilità come requisito fondamentale per la loro progettazione.

Hajime Shimao, Warut Khern-am-nuai, Sung Joo KimWed, 11 Ma🤖 cs.AI

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

Il paper introduce AgenticCyOps, un quadro di sicurezza architetturale che protegge l'integrazione di sistemi multi-agente basati su LLM nelle operazioni informatiche aziendali definendo confini di fiducia e cinque principi difensivi per mitigare le superfici di attacco legate all'orchestrazione degli strumenti e alla gestione della memoria.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Il paper propone \texttt{RQRE-OVI}, un algoritmo di iterazione dei valori ottimistico basato su approssimazione lineare che calcola l'Equilibrio di Risposta Quantale Sensibile al Rischio (RQRE) in giochi di Markov a somma generale, offrendo un compromesso controllabile tra prestazioni ottimali e robustezza rispetto agli errori di approssimazione e alla molteplicità degli equilibri.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

Il paper presenta ToolRosetta, un framework unificato che automatizza la conversione di repository di codice open-source in strumenti MCP compatibili per agenti LLM, riducendo lo sforzo umano e migliorando le prestazioni dei task attraverso un'ispezione di sicurezza integrata.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs