More Bang for the Buck: Process Reward Modeling with Entropy-Driven Uncertainty

Deze paper introduceert EDU-PRM, een nieuw trainingsframework dat gebruikmaakt van entropie-gedreven onzekerheid om complexe redeneerstappen automatisch te segmenteren zonder dure handmatige annotaties, waardoor het op het ProcessBench-benchmark presteert met slechts 1,5% van de trainingsdata en tegelijkertijd de nauwkeurigheid verhoogt terwijl het tokenverbruik met 32% daalt.

Lang Cao, Renhong Chen, Yingtian Zou, Chao Peng, Huacong Xu, Yuxian Wang, Wu Ning, Qian Chen, Mofan Peng, Zijie Chen, Peishuo Su, Yitong Li2026-03-10🤖 cs.LG

Enhancing Metabolic Syndrome Prediction with Hybrid Data Balancing and Counterfactuals

Deze studie verbetert de voorspelling van metabool syndroom door een nieuw hybride framework genaamd MetaBoost te introduceren dat geavanceerde databalanceringstechnieken combineert met contrafactuele analyse om zowel de nauwkeurigheid van machine learning-modellen te verhogen als klinisch relevante inzichten te bieden over risicofactoren zoals bloedsuiker en triglyceriden.

Sanyam Paresh Shah, Abdullah Mamun, Shovito Barua Soumma + 1 more2026-03-10🤖 cs.AI

SFIBA: Spatial-based Full-target Invisible Backdoor Attacks

Deze paper introduceert SFIBA, een nieuwe aanvalsmethode die multi-target backdoors in diepe neurale netwerken realiseert door triggers in specifieke ruimtelijke gebieden te injecteren via frequentiedomein-transformaties, waardoor zowel de onopgemerkbaarheid als de vermijding van bestaande verdedigingen wordt gegarandeerd zonder de prestaties op schone data te beïnvloeden.

Yangxu Yin, Honglong Chen, Yudong Gao, Peng Sun, Zhishuai Li, Weifeng Liu2026-03-10💻 cs

Multi-Domain Audio Question Answering Benchmark Toward Acoustic Content Reasoning

Dit paper introduceert Task 5 van de DCASE 2025 Challenge, een meerdimensionale benchmark voor audio-vraag-antwoordtaken die de redeneervermogens van audio-taalmodellen in diverse akoestische domeinen evalueert.

Chao-Han Huck Yang, Sreyan Ghosh, Qing Wang, Jaeyeon Kim, Hengyi Hong, Sonal Kumar, Guirui Zhong, Zhifeng Kong, S Sakshi, Vaibhavi Lokegaonkar, Oriol Nieto, Ramani Duraiswami, Dinesh Manocha, Gunhee Kim, Jun Du, Rafael Valle, Bryan Catanzaro2026-03-10💬 cs.CL

Precision Proactivity: Measuring Cognitive Load in Real-World AI-Assisted Work

Deze studie onderzocht bij 34 financiële professionals hoe cognitieve belasting prestaties beïnvloedt bij AI-ondersteund werk en concludeerde dat extrane belasting, vooral veroorzaakt door door het model geïnitieerde taakwisselingen, de grootste negatieve impact heeft, terwijl AI-gegenereerde inhoud de kwaliteit wel verbetert maar deze voordelen niet volledig compenseert voor de cognitieve kosten.

Brandon Lepine, Juho Kim, Pamela Mishkin, Matthew Beane2026-03-10💻 cs

MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision

Het paper introduceert MAS-ZERO, het eerste zelfevoluerende raamwerk voor het ontwerpen van multi-agent systemen zonder toezicht dat tijdens de inferentie dynamisch agentconfiguraties aanpast en verfijnt op basis van meta-feedback, waardoor het aanzienlijk beter presteert dan bestaande handmatige en automatische methoden op diverse complexe taken.

Zixuan Ke, Austin Xu, Yifei Ming, Xuan-Phi Nguyen, Ryan Chin, Caiming Xiong, Shafiq Joty2026-03-10🤖 cs.LG

Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations

Dit artikel introduceert een nieuwe methode die prompt-injectie-aanvallen op grote taalmodellen effectiever bestrijdt door het bevoorrechte instructieniveau niet alleen aan de invoer, maar ook in de tussenliggende neurale representaties te coderen, wat leidt tot een aanzienlijke vermindering van de aanvalssuccesratio's zonder de nuttigheid van het model te schaden.

Sanjay Kariyappa, G. Edward Suh2026-03-10🤖 cs.LG

Representing local protein environments with machine learning force fields

In dit artikel wordt een nieuwe representatie voor lokale eiwitomgevingen voorgesteld, afgeleid van atomaire foundation-modellen, die niet alleen structurele en chemische kenmerken effectief vastlegt maar ook leidt tot een baanbrekende, fysisch geïnformeerde voorspeller voor chemische verschuivingen in biomoleculaire NMR-spectroscopie.

Meital Bojan, Sanketh Vedula, Advaith Maddipatla, Nadav Bojan Sellam, Anar Rzayev, Federico Napoli, Paul Schanda, Alex M. Bronstein2026-03-10💻 cs

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

Dit paper introduceert MMTU, een uitgebreid benchmark met meer dan 28.000 vragen over 25 real-world tabellataken, om de complexiteit van het begrijpen, redeneren en manipuleren van tabellen door geavanceerde AI-modellen te evalueren en aan te tonen dat er nog aanzienlijke ruimte voor verbetering is.

Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. Jagadish2026-03-10🤖 cs.LG

BemaGANv2: Discriminator Combination Strategies for GAN-based Vocoders in Long-Term Audio Generation

Dit paper introduceert BemaGANv2, een geavanceerde GAN-gebaseerde vocoder voor hoogwaardige en langdurige audio-generatie die gebruikmaakt van innovatieve architecturale wijzigingen en een systematische evaluatie van discriminatorscombinaties om temporale coherentie en harmonische structuur te verbeteren.

Taesoo Park, Mungwi Jeong, Mingyu Park, Narae Kim, Junyoung Kim, Mujung Kim, Jisang Yoo, Hoyun Lee, Sanghoon Kim, Soonchul Kwon2026-03-10🤖 cs.LG