In-Context Reinforcement Learning for Tool Use in Large Language Models

Deze paper introduceert In-Context Reinforcement Learning (ICRL), een schaalbaar en data-efficiënt framework dat grote taalmodellen zonder voorafgaande gesuperviseerde fijne afstemming (SFT) leert externe hulpmiddelen effectief te gebruiken door tijdens het trainingsproces geleidelijk van few-shot naar zero-shot prompting over te schakelen.

Yaoqi Ye, Yiran Zhao, Keyu Duan, Zeyu Zheng, Kenji Kawaguchi, Cihang Xie, Michael Qizhe Shieh2026-03-10💻 cs

TALON: Test-time Adaptive Learning for On-the-Fly Category Discovery

Het paper introduceert TALON, een adaptief leerframework dat de beperkingen van bestaande hash-gebaseerde methoden voor on-the-fly categorieontdekking overwint door testtijd-adaptatie en semantische prototype-updates te gebruiken, waardoor het model dynamisch nieuwe kennis kan verwerven zonder last te hebben van categorie-explosie.

Yanan Wu, Yuhan Yan, Tailai Chen, Zhixiang Chi, ZiZhang Wu, Yi Jin, Yang Wang, Zhenbo Li2026-03-10💻 cs

Augmented Model Predictive Control: A Balance between Satellite Agility and Computation Complexity

Dit paper introduceert een geavanceerde Model Predictive Control-methode die een evenwicht creëert tussen de wendbaarheid van aardobservatiesatellieten en de rekenkracht, door de prestaties van niet-lineaire MPC te combineren met de rekenkundige eenvoud van lineaire MPC.

Yiming Wang, Mihindukulasooriya Sheral Crescent Tissera, Haihong Yu, Kai Jie Ethan Foo, Sean Yeo Keyuan, Ankit Srivastava, Hao An2026-03-10💻 cs

M-ABD: Scalable, Efficient, and Robust Multi-Affine-Body Dynamics

Dit artikel introduceert M-ABD, een schaalbaar en robuust raamwerk voor het simuleren van grote gearticuleerde systemen dat door het gebruik van lineaire kinematische mapping en een co-rotatiebenadering interactieve snelheden en grote tijdstappen mogelijk maakt op één CPU-kern.

Zhiyong He (University of Utah), Dewen Guo (University of Utah), Minghao Guo (MIT), Yili Zhao (ByteDance), Wojciech Matusik (MIT), Hao Su (UCSD), Chenfanfu Jiang (UCLA), Peter Yichen Chen (UBC), Yin Yang (University of Utah)2026-03-10💻 cs

MRDrive: An Open Source Mixed Reality Driving Simulator for Automotive User Research

Dit artikel introduceert MRDrive, een open-source gemengde-realiteit-simulatiesysteem dat onderzoekers in staat stelt in-vehicle interfaces te evalueren door een echte voertuigcabine te combineren met een volledig virtueel rijomgeving, waardoor zowel ecologische validiteit als experimentele controle worden geboden.

Patrick Ebel, Michał Patryk Miazga, Martin Lorenz, Timur Getselev, Pavlo Bazilinskyy, Celine Conzen2026-03-10💻 cs

From Reactive to Map-Based AI: Tuned Local LLMs for Semantic Zone Inference in Object-Goal Navigation

Dit paper introduceert een nieuwe 'Map-Based AI'-benadering voor object-navigatie die een lokaal, op LoRA gefinetuned Llama-2-model combineert met een hybride topologisch-roosterkaart om semantische zones te infereren en systematische verkenning te optimaliseren, wat leidt tot aanzienlijk betere prestaties dan traditionele reactieve methoden in de AI2-THOR-simulatie.

Yudai Noda, Kanji Tanaka2026-03-10💻 cs

DSH-Bench: A Difficulty- and Scenario-Aware Benchmark with Hierarchical Subject Taxonomy for Subject-Driven Text-to-Image Generation

Dit paper introduceert DSH-Bench, een uitgebreid benchmark met een hiërarchische taxonomie en een nieuwe consistentiemaatstaf (SICS) om subject-gedreven tekst-naar-beeldmodellen systematisch te evalueren op basis van moeilijkheidsgraad en scenario's, waardoor beperkingen van bestaande modellen worden blootgelegd en gerichte richtingen voor toekomstige verbetering worden geboden.

Zhenyu Hu, Qing Wang, Te Cao, Luo Liao, Longfei Lu, Liqun Liu, Shuang Li, Hang Chen, Mengge Xue, Yuan Chen, Chao Deng, Peng Shu, Huan Yu, Jie Jiang2026-03-10💻 cs

''I don't want to break it'': An Exploration of Perceived Fragility in Shape-Changing Interfaces

Dit onderzoek verkent hoe gebruikers de kwetsbaarheid van vormveranderende interfaces waarnemen en ontwikkelt een raamwerk om deze perceptie te begrijpen en de robuustheid van toekomstige ontwerpen te verbeteren.

Eva Mackamul (IIHM), Tom Maillard (IIHM), Noé Marceaul (IIHM), Yelli Coulibaly (IIHM), Julien Pansiot (SED [Grenoble]), Laurence Boissieux (SED [Grenoble]), Dominique Vaufreydaz (LIG, M-PSI), Anne Roudaut (IIHM), Céline Coutrix (IIHM)2026-03-10💻 cs

DeReCo: Decoupling Representation and Coordination Learning for Object-Adaptive Decentralized Multi-Robot Cooperative Transport

DeReCo is een nieuw decentraliseerd multi-robot leerframework dat representatie- en coördinatielering ontkoppelt via een drie-traps trainingsstrategie, waardoor de sample-efficiëntie en generalisatie voor het samenwerken bij het transporteren van objecten met uiteenlopende vormen en eigenschappen aanzienlijk worden verbeterd.

Kazuki Shibata, Ryosuke Sota, Shandil Dhiresh Bosch, Yuki Kadokawa, Tsurumine Yoshihisa, Takamitsu Matsubara2026-03-10💻 cs

SAMoE-VLA: A Scene Adaptive Mixture-of-Experts Vision-Language-Action Model for Autonomous Driving

Dit artikel introduceert SAMoE-VLA, een autonoom rijmodel dat de instabiliteit van bestaande token-gebaseerde MoE-mechanismen oplost door expertselectie te baseren op gestructureerde verkeerscènes en een conditionele cross-modale causale aandachtmechanisme, waardoor het state-of-the-art prestaties bereikt met minder parameters.

Zihan You, Hongwei Liu, Chenxu Dang, Zhe Wang, Sining Ang, Aoqi Wang, Yan Wang2026-03-10💻 cs

UIS-Digger: Towards Comprehensive Research Agent Systems for Real-world Unindexed Information Seeking

Deze paper introduceert UIS-Digger, een nieuw multi-agent framework dat de beperkingen van huidige zoekagenten bij het vinden van niet-geïndexeerde informatie aanpakt door middel van een nieuw benchmark (UIS-QA) en een effectieve oplossing die zelfs superieure prestaties boekt ten opzichte van geavanceerde modellen zoals O3 en GPT-4.1.

Chang Liu, Chuqiao Kuang, Tianyi Zhuang, Yuxin Cheng, Huichi Zhou, Xiaoguang Li, Lifeng Shang2026-03-10💻 cs