cs.MA Arbeiten | Gist.Science

TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size

Das Paper stellt TeamHOI vor, ein dezentralisiertes Framework, das mithilfe eines Transformer-basierten Policies und einer maskierten adversariellen Bewegungsprior-Methode (AMP) physisch plausible und skalierbare kooperative Mensch-Objekt-Interaktionen für Teams beliebiger Größe ermöglicht.

Stefan Lionar, Gim Hee LeeTue, 10 Ma💻 cs

Modeling the Senegalese artisanal fisheries migrations

Diese Studie nutzt ein Multi-Agenten-Modell, um zu zeigen, dass eine Reduzierung des Fischereiaufwands entscheidend für die Erhaltung der senegalesischen Handfischerei ist, während der Klimawandel nur einen geringen Einfluss hat und ohne solche Maßnahmen ein Kollaps der Fischbestände sowie massive Migrationen der Fischer drohen.

Alassane Bah (ESP, UMMISCO), Timothée Brochier (UMMISCO, IRD [Ile-de-France])Tue, 10 Ma💻 cs

Less is More: Robust Zero-Communication 3D Pursuit-Evasion via Representational Parsimony

Die Studie zeigt, dass die gezielte Reduktion von Agenten-Kommunikationskanälen und die Einführung einer lokalitätsbasierten Kreditvergabe die Robustheit und den Erfolg von dezentralen 3D-Verfolgungs-Szenarien in lauten und verzögerten Umgebungen im Vergleich zu vollvernetzten Ansätzen signifikant steigern.

Jialin Ying, Zhihao Li, Zicheng Dong, Guohua Wu, Yihuan LiaoTue, 10 Ma💻 cs

IronEngine: Towards General AI Assistant

Der Artikel stellt IronEngine vor, eine umfassende KI-Assistentenplattform mit einem einheitlichen Orchestrierungskern, die durch einen dreistufigen Planungs- und Ausführungsprozess, eine adaptive Modellverwaltung und eine robuste Werkzeugintegration eine zuverlässige Automatisierung für allgemeine Aufgaben ermöglicht.

Xi MoTue, 10 Ma🤖 cs.LG

Mindstorms in Natural Language-Based Societies of Mind

Die Arbeit stellt natürliche sprachbasierte Gesellschaften des Geistes (NLSOMs) vor, die durch die modulare Zusammenarbeit großer multimodaler neuronaler Netze über eine natürliche Schnittstelle komplexe KI-Aufgaben lösen und dabei neue Forschungsfragen zur optimalen sozialen Struktur und ökonomischen Steuerung solcher heterogenen Agenten-Systeme aufwerfen.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen SchmidhuberThu, 12 Ma💬 cs.CL

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

Die Arbeit stellt ein neues Framework für die Level-2-Inferenz vor, das in dezentralen Szenarien wie dem autonomen Fahren die Schätzungen von Agenten über die Ziele anderer erfasst, um die Beschränkungen bestehender Level-1-Methoden zu überwinden, die fälschlicherweise von vollständigem Wissen über die Ziele aller Akteure ausgehen.

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Die Autoren stellen das Yokai Learning Environment (YLE) als neue Benchmark für die Null-Shot-Koordination vor, die durch das Verfolgen von Überzeugungen über bewegliche Karten und das Schließen unter mehrdeutigen Hinweisen bestehende Methoden herausfordert und zeigt, dass auf dem bisherigen Standardbenchmark Hanabi erzielte Fortschritte nicht unbedingt auf komplexere Szenarien verallgemeinern.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas BullingThu, 12 Ma🤖 cs.AI

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

Die Arbeit zeigt, dass die Erweiterung von kausalen Normalformspielen auf sequenzielle Szenarien trotz theoretischer Eleganz und PSPACE-Vollständigkeit in der Praxis keine Wohlfahrtsverbesserung gegenüber klassischen Stackelberg-Gleichgewichten bietet, da rationale Rückwärtsinduktion kausale Vorteile eliminiert und somit neue theoretische Rahmenwerke jenseits des Nash-Gleichgewichts für KI-Agenten erforderlich macht.

Dennis ThummThu, 12 Ma📊 stat

ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System

Das Paper stellt ThunderAgent vor, ein schnelles und programmorientiertes Agentic-Inferenzsystem, das durch die Abstraktion von Workflows als LLM-Programme und eine einheitliche Ressourcenverwaltung die KV-Cache-Trefferquoten maximiert, Speicherungleichgewichte ausgleicht und im Vergleich zu bestehenden Systemen die Durchsatzleistung sowie die Speichereffizienz erheblich verbessert.

Hao Kang, Ziyang Li, Xinyu Yang, Weili Xu, Yinfang Chen, Junxiong Wang, Beidi Chen, Tushar Krishna, Chenfeng Xu, Simran AroraThu, 12 Ma💻 cs

Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead

Diese Positionspapier betrachtet Multi-Agenten-Speicher als Computer-Architekturproblem, schlägt eine dreischichtige Speicherhierarchie vor und identifiziert die Konsistenz des Multi-Agenten-Speichers als die dringendste offene Herausforderung für zuverlässige und skalierbare Systeme.

Zhongming Yu, Naicheng Yu, Hejia Zhang, Wentao Ni, Mingrui Yin, Jiaying Yang, Yujie Zhao, Jishen ZhaoThu, 12 Ma🤖 cs.AI

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

Das Paper stellt KernelSkill vor, ein Multi-Agenten-Framework mit einer dualen Speicherarchitektur, das durch die Nutzung von wissensbasierten Expertenfähigkeiten anstelle impliziter Heuristiken GPU-Kernel-Optimierungen effizienter und interpretierbarer gestaltet und dabei auf dem KernelBench signifikante Geschwindigkeitssteigerungen erzielt.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang LiuThu, 12 Ma🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

Das Paper stellt GRACE vor, einen einheitlichen 2D-Simulator und Benchmark, der Multi-Robot-Path-Planning-Aufgaben auf verschiedenen Abstraktionsebenen (Gitter, Roadmap, kontinuierlich) konsistent abbildet, um transparente Vergleiche zwischen verschiedenen Planungsansätzen zu ermöglichen und die Trade-offs zwischen Modelltreue und Skalierbarkeit zu quantifizieren.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang HönigThu, 12 Ma🤖 cs.AI

LLMGreenRec: LLM-Based Multi-Agent Recommender System for Sustainable E-Commerce

Die Arbeit stellt LLMGreenRec vor, ein neuartiges Multi-Agenten-System auf Basis von Large Language Models, das durch die Analyse von Nutzerabsichten nachhaltige Produktempfehlungen für den E-Commerce generiert und gleichzeitig den digitalen CO₂-Fußabdruck minimiert.

Hao N. Nguyen, Hieu M. Nguyen, Son Van Nguyen, Nguyen Thi HanhThu, 12 Ma💻 cs

COMIC: Agentic Sketch Comedy Generation

Die Arbeit stellt ein vollautomatisiertes KI-System vor, das mithilfe einer populationbasierter Agentenarchitektur und durch Analyse von YouTube-Comedy-Videos trainierter LLM-Kritiker kurze Sketch-Comedy-Videos in professioneller Qualität generiert.

Susung Hong, Brian Curless, Ira Kemelmacher-Shlizerman, Steve SeitzThu, 12 Ma💬 cs.CL

OA-Bug: An Olfactory-Auditory Augmented Bug Algorithm for Swarm Robots in a Denied Environment

Dieser Beitrag stellt den OA-Bug-Algorithmus vor, der schwarmbasierte Roboter durch die Nutzung olfaktorischer und auditorischer Signale befähigt, in GNSS-verweigernden Umgebungen ohne zentrale Koordination eine signifikant höhere Suchabdeckung zu erreichen.

Siqi Tan, Xiaoya Zhang, Jingyao Li, Ruitao Jing, Mufan Zhao, Yang Liu, Quan QuanMon, 09 Ma💻 cs

Aligning Compound AI Systems via System-level DPO

Die Arbeit stellt SysDPO vor, ein Framework, das die direkte Präferenzoptimierung (DPO) auf komplexe, aus mehreren Komponenten bestehende KI-Systeme erweitert, um diese durch eine graphbasierte Modellierung und systemweite Optimierung effektiv an menschliche Präferenzen anzupassen, ohne auf differenzierbare Interaktionen angewiesen zu sein.

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi KoyejoMon, 09 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

Die Arbeit stellt KramaBench vor, einen Benchmark mit 104 manuell erstellten Herausforderungen, der zeigt, dass aktuelle KI-Systeme zwar einzelne Datenaufgaben bewältigen können, aber beim Entwurf und der Ausführung funktionsfähiger End-to-End-Pipelines zur Gewinnung von Erkenntnissen aus komplexen Data Lakes erhebliche Schwierigkeiten haben.

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

A Multi-Agent System Enables Versatile Information Extraction from the Chemical Literature

Diese Arbeit stellt ein auf einem multimodalen Large Language Model basierendes Multi-Agenten-System vor, das durch die Zerlegung komplexer chemischer Extraktionsaufgaben in spezialisierte Teilaufgaben einen signifikanten Fortschritt bei der automatischen Gewinnung strukturierter Daten aus chemischer Literatur ermöglicht und dabei den bisherigen State-of-the-Art deutlich übertrifft.

Yufan Chen, Ching Ting Leung, Bowen Yu, Jianwei Sun, Yong Huang, Linyan Li, Hao Chen, Hanyu GaoMon, 09 Ma🤖 cs.AI

MARLIN: Multi-Agent Reinforcement Learning with Murmuration Intelligence and LLM Guidance for Reservoir Management

Das Paper stellt MARLIN vor, ein dezentrales Reservoir-Management-Framework, das Multi-Agenten-Reinforcement-Learning durch murmelnde Schwarmintelligenz und LLM-gesteuerte Belohnungsformung kombiniert, um unter Unsicherheiten eine skalierbare globale Koordination zu erreichen und die Hochwasserreaktion sowie die Rechenleistung signifikant zu verbessern.

Heming Fu, Shan Lin, Guojun XiongMon, 09 Ma💻 cs

Symmetry-Breaking in Multi-Agent Navigation: Winding Number-Aware MPC with a Learned Topological Strategy

Die Arbeit stellt WNumMPC vor, eine hierarchische Navigationsmethode für Multi-Agenten-Systeme, die durch den Einsatz von Reinforcement Learning zur Vorhersage von Windungszahlen und dynamischen Gewichtungen symmetriebedingte Deadlocks in dichten Szenarien effektiv vermeidet und dabei eine robuste Sim-to-Real-Übertragung ermöglicht.

Tomoki Nakao, Kazumi Kasaura, Tadashi KozunoMon, 09 Ma💻 cs

← Zurück Weiter →