Mindstorms in Natural Language-Based Societies of Mind

Die Arbeit stellt natürliche sprachbasierte Gesellschaften des Geistes (NLSOMs) vor, die durch die modulare Zusammenarbeit großer multimodaler neuronaler Netze über eine natürliche Schnittstelle komplexe KI-Aufgaben lösen und dabei neue Forschungsfragen zur optimalen sozialen Struktur und ökonomischen Steuerung solcher heterogenen Agenten-Systeme aufwerfen.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen SchmidhuberThu, 12 Ma💬 cs.CL

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

Die Arbeit stellt ein neues Framework für die Level-2-Inferenz vor, das in dezentralen Szenarien wie dem autonomen Fahren die Schätzungen von Agenten über die Ziele anderer erfasst, um die Beschränkungen bestehender Level-1-Methoden zu überwinden, die fälschlicherweise von vollständigem Wissen über die Ziele aller Akteure ausgehen.

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Die Autoren stellen das Yokai Learning Environment (YLE) als neue Benchmark für die Null-Shot-Koordination vor, die durch das Verfolgen von Überzeugungen über bewegliche Karten und das Schließen unter mehrdeutigen Hinweisen bestehende Methoden herausfordert und zeigt, dass auf dem bisherigen Standardbenchmark Hanabi erzielte Fortschritte nicht unbedingt auf komplexere Szenarien verallgemeinern.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas BullingThu, 12 Ma🤖 cs.AI

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

Die Arbeit zeigt, dass die Erweiterung von kausalen Normalformspielen auf sequenzielle Szenarien trotz theoretischer Eleganz und PSPACE-Vollständigkeit in der Praxis keine Wohlfahrtsverbesserung gegenüber klassischen Stackelberg-Gleichgewichten bietet, da rationale Rückwärtsinduktion kausale Vorteile eliminiert und somit neue theoretische Rahmenwerke jenseits des Nash-Gleichgewichts für KI-Agenten erforderlich macht.

Dennis ThummThu, 12 Ma📊 stat

ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System

Das Paper stellt ThunderAgent vor, ein schnelles und programmorientiertes Agentic-Inferenzsystem, das durch die Abstraktion von Workflows als LLM-Programme und eine einheitliche Ressourcenverwaltung die KV-Cache-Trefferquoten maximiert, Speicherungleichgewichte ausgleicht und im Vergleich zu bestehenden Systemen die Durchsatzleistung sowie die Speichereffizienz erheblich verbessert.

Hao Kang, Ziyang Li, Xinyu Yang, Weili Xu, Yinfang Chen, Junxiong Wang, Beidi Chen, Tushar Krishna, Chenfeng Xu, Simran AroraThu, 12 Ma💻 cs

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

Das Paper stellt KernelSkill vor, ein Multi-Agenten-Framework mit einer dualen Speicherarchitektur, das durch die Nutzung von wissensbasierten Expertenfähigkeiten anstelle impliziter Heuristiken GPU-Kernel-Optimierungen effizienter und interpretierbarer gestaltet und dabei auf dem KernelBench signifikante Geschwindigkeitssteigerungen erzielt.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang LiuThu, 12 Ma🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

Das Paper stellt GRACE vor, einen einheitlichen 2D-Simulator und Benchmark, der Multi-Robot-Path-Planning-Aufgaben auf verschiedenen Abstraktionsebenen (Gitter, Roadmap, kontinuierlich) konsistent abbildet, um transparente Vergleiche zwischen verschiedenen Planungsansätzen zu ermöglichen und die Trade-offs zwischen Modelltreue und Skalierbarkeit zu quantifizieren.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang HönigThu, 12 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

Die Arbeit stellt KramaBench vor, einen Benchmark mit 104 manuell erstellten Herausforderungen, der zeigt, dass aktuelle KI-Systeme zwar einzelne Datenaufgaben bewältigen können, aber beim Entwurf und der Ausführung funktionsfähiger End-to-End-Pipelines zur Gewinnung von Erkenntnissen aus komplexen Data Lakes erhebliche Schwierigkeiten haben.

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

A Multi-Agent System Enables Versatile Information Extraction from the Chemical Literature

Diese Arbeit stellt ein auf einem multimodalen Large Language Model basierendes Multi-Agenten-System vor, das durch die Zerlegung komplexer chemischer Extraktionsaufgaben in spezialisierte Teilaufgaben einen signifikanten Fortschritt bei der automatischen Gewinnung strukturierter Daten aus chemischer Literatur ermöglicht und dabei den bisherigen State-of-the-Art deutlich übertrifft.

Yufan Chen, Ching Ting Leung, Bowen Yu, Jianwei Sun, Yong Huang, Linyan Li, Hao Chen, Hanyu GaoMon, 09 Ma🤖 cs.AI

MARLIN: Multi-Agent Reinforcement Learning with Murmuration Intelligence and LLM Guidance for Reservoir Management

Das Paper stellt MARLIN vor, ein dezentrales Reservoir-Management-Framework, das Multi-Agenten-Reinforcement-Learning durch murmelnde Schwarmintelligenz und LLM-gesteuerte Belohnungsformung kombiniert, um unter Unsicherheiten eine skalierbare globale Koordination zu erreichen und die Hochwasserreaktion sowie die Rechenleistung signifikant zu verbessern.

Heming Fu, Shan Lin, Guojun XiongMon, 09 Ma💻 cs

Symmetry-Breaking in Multi-Agent Navigation: Winding Number-Aware MPC with a Learned Topological Strategy

Die Arbeit stellt WNumMPC vor, eine hierarchische Navigationsmethode für Multi-Agenten-Systeme, die durch den Einsatz von Reinforcement Learning zur Vorhersage von Windungszahlen und dynamischen Gewichtungen symmetriebedingte Deadlocks in dichten Szenarien effektiv vermeidet und dabei eine robuste Sim-to-Real-Übertragung ermöglicht.

Tomoki Nakao, Kazumi Kasaura, Tadashi KozunoMon, 09 Ma💻 cs