Mousse: Rectifying the Geometry of Muon with Curvature-Aware Preconditioning

Dit paper introduceert Mousse, een nieuwe optimizer die de stabiliteit van Muon combineert met de geometrische aanpassing van Shampoo door spectrale updates uit te voeren in een witgemaakte coördinatenruimte, wat leidt tot een aanzienlijke versnelling van het trainingsproces voor taalmodellen zonder noemenswaardige rekenkosten.

Yechen Zhang, Shuhao Xing, Junhao Huang, Kai Lv, Yunhua Zhou, Xipeng Qiu, Qipeng Guo, Kai Chen2026-03-11🤖 cs.AI

MUGEN: Evaluating and Improving Multi-audio Understanding of Large Audio-Language Models

Dit paper introduceert MUGEN, een benchmark die de beperkingen van grote audio-taalmodellen bij het verwerken van meerdere simultane audio-invoeren blootlegt en aantoont dat trainingsvrije strategieën zoals Audio-Permutational Self-Consistency de prestaties aanzienlijk verbeteren.

Chih-Kai Yang, Yun-Shao Tsai, Yu-Kai Guo, Ping-Le Tsai, Yen-Ting Piao, Hung-Wei Chen, Ting-Lin Hsiao, Yun-Man Hsu, Ke-Han Lu, Hung-yi Lee2026-03-11🤖 cs.AI

World2Mind: Cognition Toolkit for Allocentric Spatial Reasoning in Foundation Models

Het paper introduceert World2Mind, een trainingsvrije toolkit die foundation modellen in staat stelt om robuuste allocentrische ruimtelijke redenering uit te voeren door het construeren van gestructureerde cognitieve kaarten en een allocentrische ruimtelijke boom, waardoor zelfs tekst-only modellen complexe 3D-taken kunnen oplossen met prestaties die dicht bij die van geavanceerde multimodale modellen liggen.

Shouwei Ruan, Bin Wang, Zhenyu Wu, Qihui Zhu, Yuxiang Zhang, Hang Su, Yubin Wang2026-03-11🤖 cs.AI

Exploiting Label-Aware Channel Scoring for Adaptive Channel Pruning in Split Learning

Dit paper introduceert ACP-SL, een adaptief kanaalpruning-systeem voor gesplitst leren dat communicatie-overhead vermindert door label-bewuste kanaal-importantiemetingen te gebruiken om minder belangrijke kanalen te verwijderen en zo de doorgegeven 'gesmoorde' data te comprimeren zonder in te leveren op de nauwkeurigheid.

Jialei Tan, Zheng Lin, Xiangming Cai, Ruoxi Zhu, Zihan Fang, Pingping Chen, Wei Ni2026-03-11🤖 cs.AI

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Deze paper introduceert het Dynamics-Aware Policy Learning (DAPL)-framework, dat door het leren van contactgedreven dynamica via wereldmodelleren en versterkende leer, extrinsieke dexteriteit in rommelige omgevingen mogelijk maakt zonder handmatige heuristieken, met een succespercentage dat tot 50% reikt in real-world tests.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI