iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

iAgentBench is een dynamisch benchmark dat de vermogens van informatieve zoekagenten om zintuiglijke conclusies te trekken uit meerdere bronnen op populaire onderwerpen evalueert, waarbij wordt vastgesteld dat het enkel ophalen van informatie onvoldoende is voor het oplossen van complexe vragen die synthese vereisen.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

SCoUT: Scalable Communication via Utility-Guided Temporal Grouping in Multi-Agent Reinforcement Learning

Het paper introduceert SCoUT, een methode voor multi-agent versterkend leren die schaalbare communicatie mogelijk maakt door via tijdsgebonden en agent-abstractie, geleid door een differentieerbare affiniteit, zowel het moment als de ontvangers van communicatie te optimaliseren voor betere coördinatie in deeltijd waargenomen omgevingen.

Manav Vora, Gokul Puthumanaillam, Hiroyasu Tsukamoto + 1 more2026-03-06🤖 cs.AI

Competitive Multi-Operator Reinforcement Learning for Joint Pricing and Fleet Rebalancing in AMoD Systems

Dit onderzoek introduceert een competitief multi-operator versterkingsleerframework voor autonome mobiliteit-op-vraag-systemen dat, door discrete keuzetheorie te integreren, aantoont dat marktconcurrentie leidt tot lagere prijzen en andere vlootstrategieën dan in monopolistische scenario's, terwijl de agents toch robuuste beleidsregels leren.

Emil Kragh Toft, Carolin Schmidt, Daniele Gammelli + 1 more2026-03-06🤖 cs.LG

VideoChat-M1: Collaborative Policy Planning for Video Understanding via Multi-Agent Reinforcement Learning

VideoChat-M1 introduceert een innovatief multi-agent systeem voor videoanalyse dat door middel van een samenwerkend beleidsplanningsparadigma en multi-agent reinforcement learning dynamisch gereedschapsgebruik optimaliseert, waardoor het state-of-the-art prestaties bereikt op diverse benchmarks, inclusief een significante verbetering ten opzichte van Gemini 2.5 Pro en GPT-4o op het LongVideoBench-dataset.

Boyu Chen, Zikang Wang, Zhengrong Yue + 9 more2026-03-05💻 cs