Can MLLMs Read Students' Minds? Unpacking Multimodal Error Analysis in Handwritten Math

Dit artikel introduceert ScratchMath, een nieuw benchmark voor het analyseren van fouten in handgeschreven wiskundige werkbladen van studenten, en evalueert de beperkingen van multimodale grote taalmodellen bij het diagnosticeren van deze fouten in vergelijking met menselijke experts.

Dingjie Song, Tianlong Xu, Yi-Fan Zhang, Hang Li, Zhiling Yan, Xing Fan, Haoyang Li, Lichao Sun, Qingsong Wen2026-03-27🤖 cs.AI

MoE-GRPO: Optimizing Mixture-of-Experts via Reinforcement Learning in Vision-Language Models

Dit paper introduceert MoE-GRPO, een versterkingsleringsframework dat de expert-routing in Vision-Language Models optimaliseert door selectie te formuleren als een sequentiële besluitvormingsopdracht, wat leidt tot een diversere expert-selectie, minder overfitting en betere prestaties dan traditionele top-K routing.

Dohwan Ko, Jinyoung Park, Seoung Choi, Sanghyeok Lee, Seohyun Lee, Hyunwoo J. Kim2026-03-27💻 cs

Relaxed Rigidity with Ray-based Grouping for Dynamic Gaussian Splatting

Deze paper introduceert een nieuwe methode voor dynamische 3D-scène-reconstructie met 3D Gaussian Splatting die, door gebruik te maken van een straalgebaseerde groeperingsstrategie, de lokale geometrische structuur behoudt zonder afhankelijk te zijn van externe priors, wat leidt tot superieure temporele consistentie en reconstructiekwaliteit op monocular datasets.

Junoh Leea, Junmyeong Lee, Yeon-Ji Song, Inhwan Bae, Jisu Shin, Hae-Gon Jeon, Jin-Hwa Kim2026-03-27💻 cs