DIVE: Scaling Diversity in Agentic Task Synthesis for Generalizable Tool Use

Het paper introduceert DIVE, een bewijsgedreven methode die de volgorde van taaksynthese omkeert door eerst diverse real-world tool-uitvoeringen te genereren en daarop gebaseerde taken af te leiden, wat leidt tot een aanzienlijke verbetering in de generalisatie van tool-gebruikende LLM's op onbekende taken en toolsets.

Aili Chen, Chi Zhang, Junteng Liu, Jiangjie Chen, Chengyu Du, Yunji Li, Ming Zhong, Qin Wang, Zhengmao Zhu, Jiayuan Song, Ke Ji, Junxian He, Pengyu Zhao, Yanghua Xiao2026-03-13🤖 cs.AI

A Survey of Reasoning in Autonomous Driving Systems: Open Challenges and Emerging Paradigms

Deze survey analyseert de verschuiving van perceptie-gebaseerde naar redeneringscentrale autonome voertuigen, introduceert een cognitieve hiërarchie en identificeert kritieke uitdagingen zoals de spanning tussen deliberatieve taalmodellen en real-time veiligheidsvereisten voor het ontwikkelen van verifieerbare, neuro-symbolische architecturen.

Kejin Yu, Yuhan Sun, Taiqiang Wu, Ruixu Zhang, Zhiqiang Lin, Yuxin Meng, Junjie Wang, Yujiu Yang2026-03-13🤖 cs.AI

Thousand-GPU Large-Scale Training and Optimization Recipe for AI-Native Cloud Embodied Intelligence Infrastructure

Dit paper introduceert een cloudgebaseerd, duizend-GPU trainingsplatform voor embodied intelligence dat, door optimalisaties op het gebied van data, training, modelarchitectuur en infrastructuur, de trainingstijd van het GR00T-N1.5-model met een factor 40 heeft verkort en zo een cruciale basis legt voor de ontwikkeling van autonome robots.

Chen Zhou, Haoran Sun, Hedan Yang, Jing Long, Junwu Xiong, Luqiao Wang, Mingxi Luo, Qiming Yang, Shuai Di, Song Wang, Tianyun Zhao, Wanting Xu, Wen Huang, Xiaodong Bai, Xiaomeng Tian, Xiaolong Xiang, Yicheng Gong, Yongjian Guo, Yucheng Guo, Yunxuan Ma, Yu Wei, Zhong Guan, Zhen Sun2026-03-13🤖 cs.AI

Representation Finetuning for Continual Learning

Dit paper introduceert CoRe, een nieuw kader voor continu leren dat het fijne afstemmen van modellen verschuift van de gewicht-ruimte naar de representatie-ruimte door taakspecifieke ingrepen in een laag-rang lineaire deelruimte, waardoor zowel stabiliteit voor eerdere taken als plasticiteit voor nieuwe taken wordt gewaarborgd met uitzonderlijke parameter-efficiëntie.

Haihua Luo, Xuming Ran, Tommi Kärkkäinen, Huiyan Xue, Zhonghua Chen, Qi Xu, Fengyu Cong2026-03-13🤖 cs.LG

Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios

Deze studie evalueert de autonome cyberaanvalscapaciteiten van zeven AI-modellen tussen augustus 2024 en februari 2026 op twee complexe netwerkranges en concludeert dat de prestaties log-lineair schalen met rekentijd, waarbij de nieuwste modellen aanzienlijke vooruitgang boeken, hoewel ze nog beperkt blijven bij industriële besturingssystemen.

Linus Folkerts, Will Payne, Simon Inman, Philippos Giavridis, Joe Skinner, Sam Deverett, James Aung, Ekin Zorer, Michael Schmatz, Mahmoud Ghanem, John Wilkinson, Alan Steer, Vy Hong, Jessica Wang2026-03-13🤖 cs.AI

MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries

Dit paper introduceert MDER-DR, een nieuw framework voor meerhop-vraagbeantwoording dat de beperkingen van traditionele RAG-systemen op kennisgrafieken overwint door een nieuwe indexeringsmethode (MDER) en een decompositie-retrievalmechanisme (DR) te combineren, wat leidt tot aanzienlijk betere prestaties dan bestaande baselines.

Riccardo Campi, Nicolò Oreste Pinciroli Vago, Mathyas Giudici, Marco Brambilla, Piero Fraternali2026-03-13💬 cs.CL