Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

Il paper propone CoHet, un algoritmo di apprendimento per rinforzo multi-agente decentralizzato che utilizza una ricompensa intrinseca basata su Reti Neurali su Grafi per migliorare la cooperazione tra agenti eterogenei in ambienti con osservabilità parziale e segnali di reward radi, ottenendo prestazioni superiori rispetto allo stato dell'arte.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Questo lavoro propone un approccio basato su funzioni di barriera di controllo e ottimizzazione differenziabile per apprendere in modo efficiente e interpretabile le allocazioni di responsabilità degli agenti nelle interazioni multi-agente, permettendo di codificare fattori sociali e contestuali per garantire interazioni sicure ed efficienti.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

Il paper introduce GateLens, un agente LLM che utilizza l'Algebra Relazionale come rappresentazione intermedia formale per garantire analisi rapide, trasparenti e affidabili di dati tabulari complessi nel settore automobilistico, superando i limiti dei sistemi basati su Chain-of-Thought e riducendo i tempi di analisi dell'80% senza necessità di esempi few-shot.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Il lavoro propone CORA, un metodo di assegnazione del credito per l'apprendimento per rinforzo multi-agente cooperativo che utilizza il nucleo della teoria dei giochi cooperativi e il campionamento casuale delle coalizioni per allocare in modo più efficace i vantaggi globali e promuovere comportamenti coordinati ottimali.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Il paper propone un nuovo framework di apprendimento per rinforzo multi-agente che utilizza un modello generalizzato vincolato alle comunicazioni come prior di apprendimento per distinguere tra messaggi persi e integri, disaccoppiandone l'impatto decisionale e quantificandolo nella ricompensa globale per migliorare la cooperazione in scenari reali complessi.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Il paper presenta \texttt{electoral\_sim}, un framework open-source in Python che simula e confronta diversi sistemi elettorali in scenari di distribuzione degli elettori, valutandoli in base alla loro capacità di avvicinarsi alla mediana geometrica della distribuzione e includendo un meccanismo ipotetico basato su un kernel softmax di Boltzmann come limite teorico superiore.

Sumit MukherjeeWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

Il paper presenta Scale-Plan, un framework scalabile che combina modelli linguistici e pianificazione simbolica per generare rappresentazioni compatte di compiti multi-robot eterogenei, superando le limitazioni di allucinazione e scalabilità degli approcci esistenti attraverso la filtrazione delle informazioni irrilevanti e la validazione su un nuovo benchmark MAT2-THOR.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

Il documento presenta il LLM Delegate Protocol (LDP), un protocollo di comunicazione nativo per l'intelligenza artificiale che introduce identità dei modelli, tracciamento della provenienza e sessioni governate per abilitare una delega più efficiente e controllabile nei sistemi multi-agente, dimostrando attraverso un'implementazione su JamJet significativi miglioramenti nella latenza e nell'efficienza dei token, sebbene con risultati contrastanti sulla qualità complessiva e la necessità di verifica per i metadati di fiducia.

Sunil PrakashWed, 11 Ma🤖 cs.AI

Latent World Models for Automated Driving: A Unified Taxonomy, Evaluation Framework, and Open Challenges

Questo articolo propone un quadro unificato per i modelli di mondo latenti nella guida automatizzata, presentando una tassonomia che organizza le rappresentazioni latenti, delineando cinque meccanismi interni fondamentali, introducendo un framework di valutazione per colmare il divario tra scenari open-loop e closed-loop e identificando le sfide aperte per sistemi decisionali verificabili ed efficienti.

Rongxiang Zeng, Yongqi DongWed, 11 Ma🤖 cs.AI

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

Il paper introduce AgenticCyOps, un quadro di sicurezza architetturale che protegge l'integrazione di sistemi multi-agente basati su LLM nelle operazioni informatiche aziendali definendo confini di fiducia e cinque principi difensivi per mitigare le superfici di attacco legate all'orchestrazione degli strumenti e alla gestione della memoria.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Il paper propone \texttt{RQRE-OVI}, un algoritmo di iterazione dei valori ottimistico basato su approssimazione lineare che calcola l'Equilibrio di Risposta Quantale Sensibile al Rischio (RQRE) in giochi di Markov a somma generale, offrendo un compromesso controllabile tra prestazioni ottimali e robustezza rispetto agli errori di approssimazione e alla molteplicità degli equilibri.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

Il paper presenta ToolRosetta, un framework unificato che automatizza la conversione di repository di codice open-source in strumenti MCP compatibili per agenti LLM, riducendo lo sforzo umano e migliorando le prestazioni dei task attraverso un'ispezione di sicurezza integrata.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs