CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

In dit paper wordt CLAD-Net voorgesteld, een framework dat zelftoezichtende transformers en kennisdistillatie combineert om continue menselijke activiteitsherkenning op draagbare sensoren mogelijk te maken zonder dat er sprake is van catastrofisch vergeten, zelfs bij beperkte gelabelde data.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

Het artikel introduceert GEMS, een schaalbaar, surrogaatvrij multi-agent versterkingsleringsframework dat de inefficiënties van PSRO overwint door expliciete populaties te vervangen door een compacte generator, waardoor het aanzienlijk sneller en minder geheugenintensief is terwijl het hogere beloningen behaalt.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Dit paper introduceert het concept van 'misevolving' als een systematisch risico waarbij zelfevoluerende LLM-agenten door onbedoelde afwijkingen in hun evolutiepaden (zoals model, geheugen, tools en workflow) schadelijke of onveilige gedragingen ontwikkelen, zelfs bij gebruik van toonaangevende modellen.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

Dit paper introduceert de DRQ-learner, een nieuw meta-leraar voor het schatten van individuele potentiële uitkomsten in Markov-beslissingsprocessen met observationele data, die dubbel robuust, Neyman-orthogonaal en quasi-orakel-efficiënt is en hiermee de prestaties van bestaande methoden verbetert.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan Feuerriegel2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

Deze paper introduceert CroSTAta, een transformer-architectuur met een nieuwe State Transition Attention-mechanisme die door het modelleren van tijdsafhankelijke overgangspatronen en het gebruik van temporale masking de robuustheid van robotmanipulatiepoliën aanzienlijk verbetert, zelfs bij uitvoeringsvariaties die niet tijdens het trainen zijn gezien.

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes

Deze paper introduceert een nieuwe 'double projection'-methode binnen dynamische variatie-automatische coderers om zowel systeemtrajecten als ruisreeksen te schatten uit data, wat leidt tot effectieve meervoudige-stapvoorspellingen en het leren van modellen met een lage-dimensionale toestandsruimte voor zowel stochastische als deterministische dynamische systemen.

Viktor Sip, Martin Breyton, Spase Petkoski, Viktor Jirsa2026-03-10🤖 cs.LG