cs.MA papers | Gist.Science

TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size

TeamHOI is een framework dat een enkele decentrale policy gebruikt, gebaseerd op een Transformer-architectuur en een gemaskerde Adversarial Motion Prior-strategie, om realistische en schaalbare samenwerking tussen mensachtige robots bij het dragen van objecten mogelijk te maken, ongeacht het aantal teamleden of de vorm van het object.

Stefan Lionar, Gim Hee LeeTue, 10 Ma💻 cs

Modeling the Senegalese artisanal fisheries migrations

Dit onderzoek presenteert een multi-agent simulatiemodel dat aantoont dat, ondanks een beperkte impact van klimaatverandering, een vermindering van de visserijinspanning essentieel is om een duurzame evenwichtstoestand in de Senegalese artisanale visserij te bereiken en massale migratie van vissers te voorkomen.

Alassane Bah (ESP, UMMISCO), Timothée Brochier (UMMISCO, IRD [Ile-de-France])Tue, 10 Ma💻 cs

Less is More: Robust Zero-Communication 3D Pursuit-Evasion via Representational Parsimony

Dit paper toont aan dat het elimineren van redundante communicatiekanalen en het toepassen van representatieve parsimonie, gecombineerd met Contribution-Gated Credit Assignment, leidt tot robuustere en succesvollere 3D-vervolging in complexe omgevingen vergeleken met methoden die afhankelijk zijn van rijkere inter-agent koppelingen.

Jialin Ying, Zhihao Li, Zicheng Dong, Guohua Wu, Yihuan LiaoTue, 10 Ma💻 cs

IronEngine: Towards General AI Assistant

Dit artikel introduceert IronEngine, een geavanceerd AI-assistentplatform dat via een geünificeerde orchestratiekern en een drie-fasenpipeline planning en uitvoering scheidt, waardoor het een robuuste basis vormt voor algemene persoonlijke assistenten en automatiseringsframeworks.

Xi MoTue, 10 Ma🤖 cs.LG

Mindstorms in Natural Language-Based Societies of Mind

Dit paper introduceert natuurlijke taal-gebaseerde samenlevingen van geest (NLSOMs), waarin diverse neurale netwerken via een gemeenschappelijke taalinterface samenwerken in een 'mindstorm' om complexe multimodale taken op te lossen en de sociale structuur van toekomstige AI-samenlevingen te onderzoeken.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen SchmidhuberThu, 12 Ma💬 cs.CL

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

Deze paper introduceert een niveau-2 inverse-speltheoretisch raamwerk dat, in tegenstelling tot bestaande niveau-1-methoden, de schattingen van agenten over elkaars doelen infereert om misalignments in gedecentraliseerde scenario's zoals stedelijk rijden nauwkeuriger te verklaren.

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Dit paper introduceert het Yokai Learning Environment (YLE), een uitdagende nieuwe benchmark voor zero-shot coördinatie die de beperkingen van de bestaande Hanabi-benchmark blootlegt door te vereisen dat agenten geloofsoverdracht, ambiguïteit en spelbeëindiging beheren, waardoor wordt aangetoond dat huidige toonaangevende methoden in YLE falen terwijl ze in Hanabi uitstekend presteren.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas BullingThu, 12 Ma🤖 cs.AI

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

Hoewel het artikel een theoretisch uitbreiding van causale speltheorie naar sequentiële settings introduceert, concludeert het dat deze aanpak geen welvaartswinst biedt ten opzichte van klassieke Stackelberg-evenwichten, omdat rationele terugwaartse afleiding elke strategische meerwaarde van causale lagen elimineert.

Dennis ThummThu, 12 Ma📊 stat

ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System

ThunderAgent is een snelle en programabewuste agentic-inferentiesysteem dat agentic-workflows abstracteert als LLM-programma's om middelen zoals KV-cache en tool-omgevingen geïntegreerd te beheren, wat resulteert in aanzienlijke verbeteringen in doorvoersnelheid en geheugenefficiëntie ten opzichte van bestaande systemen.

Hao Kang, Ziyang Li, Xinyu Yang, Weili Xu, Yinfang Chen, Junxiong Wang, Beidi Chen, Tushar Krishna, Chenfeng Xu, Simran AroraThu, 12 Ma💻 cs

Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead

Dit position paper presenteert een computerarchitectuurperspectief op multi-agent geheugen door een drie-laags hiërarchie en protocollen voor consistentie te definiëren als cruciale stappen voor schaalbare, betrouwbare systemen.

Zhongming Yu, Naicheng Yu, Hejia Zhang, Wentao Ni, Mingrui Yin, Jiaying Yang, Yujie Zhao, Jishen ZhaoThu, 12 Ma🤖 cs.AI

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

Het paper introduceert KernelSkill, een multi-agent framework dat de efficiëntie van GPU-kernels verbetert door impliciete heuristieken te vervangen door kennisgedreven vaardigheden en een dubbel niveau van geheugen, wat resulteert in aanzienlijke snelheidswinsten en een hogere succesratio ten opzichte van eerdere methoden.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang LiuThu, 12 Ma🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

Het paper introduceert GRACE, een geünificeerde 2D-simulatie- en benchmarkomgeving die multi-robot padplanningstaken op verschillende abstractieniveaus (raster, routekaart en continu) mogelijk maakt om transparante en reproduceerbare vergelijkingen tussen verschillende modellen en planners te faciliteren.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang HönigThu, 12 Ma🤖 cs.AI

LLMGreenRec: LLM-Based Multi-Agent Recommender System for Sustainable E-Commerce

Dit paper introduceert LLMGreenRec, een innovatief multi-agent systeem dat Large Language Models gebruikt om duurzame e-commerce te bevorderen door zowel groene aankoopintenties te detecteren als het eigen digitale koolstofvoetafdruk te minimaliseren.

Hao N. Nguyen, Hieu M. Nguyen, Son Van Nguyen, Nguyen Thi HanhThu, 12 Ma💻 cs

COMIC: Agentic Sketch Comedy Generation

Deze paper introduceert een volledig geautomatiseerd AI-systeem dat korte komediesoaps genereert door middel van een agentenpopulatie die de rollen van een productiestudio nabootst en gebruikmaakt van door LLM-aangedreven critici die zijn getraind op YouTube-data om humor te evalueren en de output te optimaliseren.

Susung Hong, Brian Curless, Ira Kemelmacher-Shlizerman, Steve SeitzThu, 12 Ma💬 cs.CL

OA-Bug: An Olfactory-Auditory Augmented Bug Algorithm for Swarm Robots in a Denied Environment

Dit paper introduceert het OA-Bug-algoritme, dat olfactorische en auditieve signalen gebruikt om zwermen van autonome robots te laten samenwerken bij het verkennen van een onbepaalde omgeving zonder GNSS of centrale verwerking, wat resulteert in een aanzienlijk verbeterde zoekdekking.

Siqi Tan, Xiaoya Zhang, Jingyao Li, Ruitao Jing, Mufan Zhao, Yang Liu, Quan QuanMon, 09 Ma💻 cs

Aligning Compound AI Systems via System-level DPO

Dit paper introduceert SysDPO, een raamwerk dat Direct Preference Optimization uitbreidt naar Compound AI-systemen door deze als gerichte acyclische grafen te modelleren, waardoor effectieve systeemgerichte uitlijning mogelijk wordt ondanks niet-differentieerbare interacties en de complexiteit van het vertalen van systeemvoorkeuren naar componentniveau.

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi KoyejoMon, 09 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

Dit paper introduceert KramaBench, een benchmark met 104 handmatig samengestelde uitdagingen die aantoont dat huidige AI-systemen, ondanks hun vaardigheden in geïsoleerde taken, moeite hebben om volledige, werkende data-naar-inzicht-pijplijnen over complexe data lakes te ontwerpen en uit te voeren.

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

A Multi-Agent System Enables Versatile Information Extraction from the Chemical Literature

Deze paper introduceert een op multimodale grote taalmodellen gebaseerd multi-agent systeem dat de extractie van chemische informatie uit diverse literatuurformaten aanzienlijk verbetert, met een F1-score van 76,27% die de huidige staat van de kunst ver overtreft.

Yufan Chen, Ching Ting Leung, Bowen Yu, Jianwei Sun, Yong Huang, Linyan Li, Hao Chen, Hanyu GaoMon, 09 Ma🤖 cs.AI

MARLIN: Multi-Agent Reinforcement Learning with Murmuration Intelligence and LLM Guidance for Reservoir Management

Het artikel introduceert MARLIN, een decentraal reservoirbeheersysteem dat multi-agent versterkende leer combineert met inspiratie uit zwermintelligentie en LLM-gestuurde beloningsvorming om onder onzekerheid schaalbare en effectieve waterbeheerstrategieën te realiseren.

Heming Fu, Shan Lin, Guojun XiongMon, 09 Ma💻 cs

Symmetry-Breaking in Multi-Agent Navigation: Winding Number-Aware MPC with a Learned Topological Strategy

Dit artikel introduceert WNumMPC, een hiërarchische navigatiemethode die symmetrie-geïnduceerde deadlocks in gedistribueerde multi-agent systemen oplost door een topologische invariant (het winding number) te combineren met versterkingslering voor het plannen van samenwerking en een modelgebaseerde regelaar voor veilige beweging.

Tomoki Nakao, Kazumi Kasaura, Tadashi KozunoMon, 09 Ma💻 cs

← Vorige Volgende →