Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

Het paper introduceert EvoKernel, een zelfevoluerend agentiek framework dat door middel van een waardegedreven geheugenaanpak en versterkingsleer de uitdagingen van het ontbreken van trainingsdata voor NPU-kernels oplost, waardoor de correctheid van generatieve modellen van 11% naar 83% stijgt en de uitvoeringssnelheid met een factor 3,6 verbetert.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

V0.5V_{0.5}: Generalist Value Model as a Prior for Sparse RL Rollouts

Dit paper introduceert V0.5V_{0.5}, een methode die een Generalist Value Model als prior combineert met empirische rollouts via real-time statistische testen en dynamische budgettoewijzing, waardoor een robuuste en efficiënte advantage-baseline wordt verkregen die significant betere prestaties en snellere convergentie bereikt dan GRPO en DAPO op wiskundige redeneerbenchmarks.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

Het paper introduceert GRACE, een geünificeerde 2D-simulatie- en benchmarkomgeving die multi-robot padplanningstaken op verschillende abstractieniveaus (raster, routekaart en continu) mogelijk maakt om transparante en reproduceerbare vergelijkingen tussen verschillende modellen en planners te faciliteren.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang Hönig2026-03-12🤖 cs.AI

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

Deze paper introduceert een tweetalig corpus en een machine-actievere GND-taxonomie voor het trainen en evalueren van AI-systemen die bibliothecarissen ondersteunen bij het automatisch toewijzen van onderwerpswoorden aan catalogusrecords.

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma Suominen2026-03-12💬 cs.CL

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Dit artikel introduceert Dynamics-Predictive Sampling (DPS), een methode die de effectiviteit van versterkingslering voor grote redeneermodellen verbetert door door middel van Bayesiaanse inferentie en een verborgen Markov-model de leerdynamiek van prompts te voorspellen, waardoor kostbare rollouts worden geminimaliseerd en het trainingsproces wordt versneld zonder in te leveren op de redeneerprestaties.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV is een lichtgewicht framework dat de prestaties van KV-cache-evictie verbetert door parameter-efficiënte modules te gebruiken om toekomstige belangrijke tokens te voorspellen zonder dure generatie, wat leidt tot een aanzienlijke vermindering van de uitvoeringstijd en kosten bij lange contexttaken.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

Contact Coverage-Guided Exploration for General-Purpose Dexterous Manipulation

Dit artikel introduceert Contact Coverage-Guided Exploration (CCGE), een algemene exploratiemethode die het contactpatroon tussen hand en object gebruikt om de trainingsefficiëntie en succespercentages van dexterous manipulatie taken te verbeteren en robuuste overdracht naar echte robotsystemen mogelijk te maken.

Zixuan Liu, Ruoyi Qiao, Chenrui Tie, Xuanwei Liu, Yunfan Lou, Chongkai Gao, Zhixuan Xu, Lin Shao2026-03-12🤖 cs.AI

RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

Dit artikel analyseert op basis van interviews met experts de methodologische uitdagingen die de dynamische aard van geavanceerde AI-systemen oplevert voor human uplift-studies en biedt praktische oplossingen om de validiteit en bruikbaarheid van deze bewijslast voor hoog-risico beslissingen te waarborgen.

Patricia Paskov, Kevin Wei, Shen Zhou Hong, Dan Bateyko, Xavier Roberts-Gaal, Carson Ezell, Gailius Praninskas, Valerie Chen, Umang Bhatt, Ella Guest2026-03-12🤖 cs.AI

Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

In een interdisciplinair onderzoek tussen computerwetenschappers en kunsthistorici wordt onderzocht hoe Vision Language Models kunststijlen herkennen en blijkt dat hun gebruikte concepten voor 90% relevant zijn en voor 73% semantisch zinvol worden bevonden door experts.

Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

Dit paper introduceert NeFTY, een differentieerbaar fysica-framework dat gebruikmaakt van neurale velden en een strikte numerieke solver om materialen kwantitatief in 3D te reconstrueren op basis van oppervlaktetemperatuurmetingen, waardoor de beperkingen van traditionele thermografie en bestaande PINN-benaderingen voor het detecteren van ondergrondse defecten worden overwonnen.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci