cs.MA Arbeiten | Gist.Science

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

Die vorgestellte Arbeit stellt CoHet vor, einen dezentralen Multi-Agenten-Reinforcement-Learning-Algorithmus, der mittels graphbasierten intrinsischen Belohnungen die Zusammenarbeit heterogener Agenten unter Bedingungen partieller Beobachtbarkeit und seltener Umweltbelohnungen effektiv verbessert.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Diese Arbeit stellt einen datengesteuerten Ansatz vor, der auf Control Barrier Functions und differenzierbarer Optimierung basiert, um die Verantwortungszuweisung von Agenten in multi-agenten Interaktionen zu lernen und so ein quantitatives Verständnis dafür zu gewinnen, wie stark Akteure ihr Verhalten anpassen, um die Sicherheit anderer zu gewährleisten.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Characterizations of voting rules based on majority margins

Diese Arbeit charakterisiert Abstimmungsregeln, die ausschließlich auf den relativen Gewinn- oder Verlustmargen zwischen Kandidaten basieren, indem sie nachweist, dass eine solche Regel genau dann marginalbasiert ist, wenn sie das Axiom der „preferential equality" erfüllt, welches fordert, dass die Präferenzen aller Wähler in Bezug auf bestimmte Kandidatenpaare gleichwertig behandelt werden.

Yifeng Ding, Wesley H. Holliday, Eric PacuitWed, 11 Ma📈 econ

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

Das Paper stellt GateLens vor, ein LLM-basiertes System für die Automobilsoftware-Analyse, das durch die Verwendung relationaler Algebra als formale Zwischenrepräsentation zwischen natürlicher Sprache und ausführbarem Code die Zuverlässigkeit und Geschwindigkeit bei der Verarbeitung komplexer tabellarischer Daten im Vergleich zu herkömmlichen Ansätzen signifikant verbessert.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Die Arbeit stellt CORA vor, eine Methode zur Kreditvergabe im kooperativen Multi-Agenten-Reinforcement-Learning, die mithilfe des Kerns der kooperativen Spieltheorie und zufälliger Koalitionsstichproben globale Vorteile effizient auf Agenten verteilt, um koordiniertes Verhalten zu fördern und die Leistung gegenüber bestehenden Baselines zu verbessern.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents

Die Arbeit stellt CMASE vor, ein Rahmenwerk für computergestützte Multi-Agenten-Gesellschaftsexperimente, das generative Agentenmodelle mit virtuellen ethnografischen Methoden verbindet, um Forscher als eingebettete Teilnehmer in Echtzeit zu ermöglichen und so komplexe soziale Interventionen mit kausaler Erklärungskraft und empirischer Genauigkeit zu simulieren.

Hanzhong Zhang, Muhua Huang, Jindong WangWed, 11 Ma🤖 cs.AI

Personalized Collaborative Learning with Affinity-Based Variance Reduction

Die Arbeit stellt AffPCL vor, einen personalisierten kollaborativen Lernrahmen für heterogene Agenten, der durch affinitätsbasierte Varianzreduktion und Korrekturmechanismen die Stichprobenkomplexität im Vergleich zum unabhängigen Lernen um einen Faktor von $\max\{n^{-1}, \delta\}$ senkt und dabei nahtlos zwischen linearem Speedup bei Homogenität und unabhängiger Lernleistung bei Heterogenität interpoliert, ohne dass Vorwissen über das System erforderlich ist.

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

Polynomial-time Configuration Generator for Connected Unlabeled Multi-Agent Pathfinding

Die Arbeit stellt PULL vor, einen leichten, vollständigen Algorithmus mit $O(n^2)$ -Laufzeit pro Schritt, der das Problem des verbundenen, unbeschrifteten Multi-Agenten-Pfadfindens (CUMAPF) für Hunderte von Agenten effizient löst und dabei die Skalierbarkeitsgrenzen von ILP-Methoden überwindet.

Takahiro Suzuki, Keisuke OkumuraWed, 11 Ma💻 cs

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Diese Arbeit stellt ein generalisiertes Multi-Agenten-Reinforcement-Learning-Framework vor, das verlustbehaftete und verlustfreie Kommunikation durch einen kommunikationsbeschränkten Prior und eine duale gegenseitige Informations-Schätzung modelliert, um die Robustheit und Skalierbarkeit kooperativer Strategien in komplexen, dynamischen Umgebungen zu verbessern.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Diese Arbeit stellt ein Meta-Spiel-Design vor, das die Entstehung algorithmischer Absprachen unter Testzeit-Bedingungen untersucht, indem es vortrainierte Strategien mit Anpassungsregeln kombiniert und deren Verhalten in wiederholten Preiswettbewerben mit Hilfe von empirischen Spielanalysen bewertet.

Yuhong Luo, Daniel Schoepflin, Xintong WangWed, 11 Ma💻 cs

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Die Arbeit stellt Coordinated Boltzmann MCTS (CB-MCTS) vor, einen neuartigen dezentralen Planungsalgorithmus, der durch eine stochastische Boltzmann-Politik und einen abklingenden Entropie-Bonus die Robustheit gegenüber spärlichen Belohnungen und irreführenden Szenarien in kooperativen Multi-Agenten-Systemen im Vergleich zu herkömmlichen Dec-MCTS-Ansätzen signifikant verbessert.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

Die Arbeit stellt ChatNeuroSim vor, ein Framework auf Basis von Large Language Models, das den gesamten Workflow für die Bereitstellung und Optimierung von Compute-in-Memory-Beschleunigern automatisiert und durch Design-Space-Pruning die Identifizierung optimaler Konfigurationen für DNN-Workloads erheblich beschleunigt.

Ming-Yen Lee, Shimeng YuWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Die Arbeit stellt \texttt{electoral\_sim}, ein Open-Source-Python-Framework vor, das verschiedene Wahlsysteme in einem zweidimensionalen ideologischen Raum simuliert und anhand des euklidischen Abstands zum geometrischen Median der Wählerverteilung vergleicht, wobei auch ein neuartiger hypothetischer Mechanismus als theoretische Obergrenze bewertet wird.

Sumit MukherjeeWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

Die Arbeit stellt Scale-Plan vor, ein skalierbares Framework, das große Sprachmodelle nutzt, um aus natürlichen Anweisungen kompakte, aufgabenrelevante Darstellungen zu generieren und so die Planung für heterogene Multi-Roboter-Teams durch die Filterung irrelevanter Informationen effizienter und zuverlässiger zu gestalten.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

Die Arbeit stellt das LLM Delegate Protocol (LDP) vor, ein KI-natives Kommunikationsprotokoll für Multi-Agenten-Systeme, das durch Identitätsbewusstsein, strukturierte Provenienz und sichere Domänen die Effizienz, Token-Nutzung und Governance bei der Delegierung von Aufgaben verbessert, wie eine Implementierung in der JamJet-Laufzeitumgebung zeigt.

Sunil PrakashWed, 11 Ma🤖 cs.AI

Latent World Models for Automated Driving: A Unified Taxonomy, Evaluation Framework, and Open Challenges

Dieser Artikel stellt ein einheitliches Taxonomie- und Evaluierungsrahmenwerk für latente Weltmodelle im automatisierten Fahren vor, das verschiedene Repräsentationsformen und strukturelle Priors systematisch kategorisiert, um Herausforderungen wie Robustheit, Generalisierung und Ressourceneffizienz zu adressieren und zukünftige Forschungsrichtungen für verifizierbare Entscheidungssysteme aufzuzeigen.

Rongxiang Zeng, Yongqi DongWed, 11 Ma🤖 cs.AI

Chaotic Dynamics in Multi-LLM Deliberation

Die Studie zeigt, dass Multi-LLM-Entscheidungsgremien selbst unter deterministischen Bedingungen durch Rollenunterschiede und Modellheterogenität chaotisch instabil werden können, was die Notwendigkeit von Stabilitätsaudits für solche Governance-Systeme unterstreicht.

Hajime Shimao, Warut Khern-am-nuai, Sung Joo KimWed, 11 Ma🤖 cs.AI

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

Die Arbeit stellt AgenticCyOps vor, ein Sicherheitsframework für die Integration multi-agentischer KI-Systeme in Unternehmen, das durch die Identifizierung von Werkzeug-Orchestrierung und Speicher-Management als primäre Angriffsflächen sowie die Einführung von fünf defensiven Prinzipien und einer mehrschichtigen Verteidigungsarchitektur die Angriffsfläche im Vergleich zu herkömmlichen Systemen um mindestens 72 % reduziert.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Die Arbeit stellt \texttt{RQRE-OVI} vor, einen optimistischen Wert-Iterationsalgorithmus mit linearer Funktionsapproximation, der das Risiko-sensitive Quantal-Response-Gleichgewicht (RQRE) berechnet und dabei eine einzigartige, glatte Lösung bietet, die im Vergleich zum Nash-Gleichgewicht eine überlegene Robustheit und Stabilität in general-sum Markov-Spielen gewährleistet.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

Das Paper stellt ToolRosetta vor, ein Framework, das Open-Source-Repositories automatisch in standardisierte, sicherheitsgeprüfte MCP-Tools für LLM-Agenten übersetzt, um die Skalierbarkeit und Leistung bei der Aufgabenerfüllung ohne manuelle Eingriffe zu verbessern.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs

Weiter →