Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Diese Arbeit stellt einen datengesteuerten Ansatz vor, der auf Control Barrier Functions und differenzierbarer Optimierung basiert, um die Verantwortungszuweisung von Agenten in multi-agenten Interaktionen zu lernen und so ein quantitatives Verständnis dafür zu gewinnen, wie stark Akteure ihr Verhalten anpassen, um die Sicherheit anderer zu gewährleisten.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Characterizations of voting rules based on majority margins

Diese Arbeit charakterisiert Abstimmungsregeln, die ausschließlich auf den relativen Gewinn- oder Verlustmargen zwischen Kandidaten basieren, indem sie nachweist, dass eine solche Regel genau dann marginalbasiert ist, wenn sie das Axiom der „preferential equality" erfüllt, welches fordert, dass die Präferenzen aller Wähler in Bezug auf bestimmte Kandidatenpaare gleichwertig behandelt werden.

Yifeng Ding, Wesley H. Holliday, Eric PacuitWed, 11 Ma📈 econ

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

Das Paper stellt GateLens vor, ein LLM-basiertes System für die Automobilsoftware-Analyse, das durch die Verwendung relationaler Algebra als formale Zwischenrepräsentation zwischen natürlicher Sprache und ausführbarem Code die Zuverlässigkeit und Geschwindigkeit bei der Verarbeitung komplexer tabellarischer Daten im Vergleich zu herkömmlichen Ansätzen signifikant verbessert.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Die Arbeit stellt CORA vor, eine Methode zur Kreditvergabe im kooperativen Multi-Agenten-Reinforcement-Learning, die mithilfe des Kerns der kooperativen Spieltheorie und zufälliger Koalitionsstichproben globale Vorteile effizient auf Agenten verteilt, um koordiniertes Verhalten zu fördern und die Leistung gegenüber bestehenden Baselines zu verbessern.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents

Die Arbeit stellt CMASE vor, ein Rahmenwerk für computergestützte Multi-Agenten-Gesellschaftsexperimente, das generative Agentenmodelle mit virtuellen ethnografischen Methoden verbindet, um Forscher als eingebettete Teilnehmer in Echtzeit zu ermöglichen und so komplexe soziale Interventionen mit kausaler Erklärungskraft und empirischer Genauigkeit zu simulieren.

Hanzhong Zhang, Muhua Huang, Jindong WangWed, 11 Ma🤖 cs.AI

Personalized Collaborative Learning with Affinity-Based Variance Reduction

Die Arbeit stellt AffPCL vor, einen personalisierten kollaborativen Lernrahmen für heterogene Agenten, der durch affinitätsbasierte Varianzreduktion und Korrekturmechanismen die Stichprobenkomplexität im Vergleich zum unabhängigen Lernen um einen Faktor von max{n1,δ}\max\{n^{-1}, \delta\} senkt und dabei nahtlos zwischen linearem Speedup bei Homogenität und unabhängiger Lernleistung bei Heterogenität interpoliert, ohne dass Vorwissen über das System erforderlich ist.

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Diese Arbeit stellt ein generalisiertes Multi-Agenten-Reinforcement-Learning-Framework vor, das verlustbehaftete und verlustfreie Kommunikation durch einen kommunikationsbeschränkten Prior und eine duale gegenseitige Informations-Schätzung modelliert, um die Robustheit und Skalierbarkeit kooperativer Strategien in komplexen, dynamischen Umgebungen zu verbessern.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Die Arbeit stellt Coordinated Boltzmann MCTS (CB-MCTS) vor, einen neuartigen dezentralen Planungsalgorithmus, der durch eine stochastische Boltzmann-Politik und einen abklingenden Entropie-Bonus die Robustheit gegenüber spärlichen Belohnungen und irreführenden Szenarien in kooperativen Multi-Agenten-Systemen im Vergleich zu herkömmlichen Dec-MCTS-Ansätzen signifikant verbessert.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Die Arbeit stellt \texttt{electoral\_sim}, ein Open-Source-Python-Framework vor, das verschiedene Wahlsysteme in einem zweidimensionalen ideologischen Raum simuliert und anhand des euklidischen Abstands zum geometrischen Median der Wählerverteilung vergleicht, wobei auch ein neuartiger hypothetischer Mechanismus als theoretische Obergrenze bewertet wird.

Sumit MukherjeeWed, 11 Ma💻 cs

Latent World Models for Automated Driving: A Unified Taxonomy, Evaluation Framework, and Open Challenges

Dieser Artikel stellt ein einheitliches Taxonomie- und Evaluierungsrahmenwerk für latente Weltmodelle im automatisierten Fahren vor, das verschiedene Repräsentationsformen und strukturelle Priors systematisch kategorisiert, um Herausforderungen wie Robustheit, Generalisierung und Ressourceneffizienz zu adressieren und zukünftige Forschungsrichtungen für verifizierbare Entscheidungssysteme aufzuzeigen.

Rongxiang Zeng, Yongqi DongWed, 11 Ma🤖 cs.AI

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

Die Arbeit stellt AgenticCyOps vor, ein Sicherheitsframework für die Integration multi-agentischer KI-Systeme in Unternehmen, das durch die Identifizierung von Werkzeug-Orchestrierung und Speicher-Management als primäre Angriffsflächen sowie die Einführung von fünf defensiven Prinzipien und einer mehrschichtigen Verteidigungsarchitektur die Angriffsfläche im Vergleich zu herkömmlichen Systemen um mindestens 72 % reduziert.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Die Arbeit stellt \texttt{RQRE-OVI} vor, einen optimistischen Wert-Iterationsalgorithmus mit linearer Funktionsapproximation, der das Risiko-sensitive Quantal-Response-Gleichgewicht (RQRE) berechnet und dabei eine einzigartige, glatte Lösung bietet, die im Vergleich zum Nash-Gleichgewicht eine überlegene Robustheit und Stabilität in general-sum Markov-Spielen gewährleistet.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

Das Paper stellt ToolRosetta vor, ein Framework, das Open-Source-Repositories automatisch in standardisierte, sicherheitsgeprüfte MCP-Tools für LLM-Agenten übersetzt, um die Skalierbarkeit und Leistung bei der Aufgabenerfüllung ohne manuelle Eingriffe zu verbessern.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs