Grounding the Score: Explicit Visual Premise Verification for Reliable Vision-Language Process Reward Models

Dit paper introduceert EVPV, een lichtgewicht verificatiemethode die de betrouwbaarheid van visuele premisses expliciet koppelt aan de scoring van redeneerstappen in Vision-Language Process Reward Models, waardoor perceptuele onzekerheid wordt ontkoppeld van logische evaluatie en de prestaties bij het herschikken van kandidaten significant worden verbeterd.

Junxin Wang, Dai Guan, Weijie Qiu, Zhihang Li, Yongbo Gai, Zhengyi Yang, Mengyu Zhou, Erchao Zhao, Xiaoxi Jiang, Guanjun Jiang2026-03-18🤖 cs.AI

Surrogate-Assisted Genetic Programming with Rank-Based Phenotypic Characterisation for Dynamic Multi-Mode Project Scheduling

Dit artikel presenteert een door surrogate-modellen ondersteund genetisch programmeringsalgoritme met een op rang gebaseerde fenotypische karakterisering dat de zoekefficiëntie voor het dynamisch meermodale projectplanningsprobleem aanzienlijk verbetert door de reeks evaluaties te verminderen terwijl het hoge kwaliteit heuristieken eerder vindt dan bestaande methoden.

Yuan Tian, Yi Mei, Mengjie Zhang2026-03-18🤖 cs.AI

VisBrowse-Bench: Benchmarking Visual-Native Search for Multimodal Browsing Agents

Dit paper introduceert VisBrowse-Bench, een nieuw benchmark voor het testen van visueel-natief zoeken in multimodale browse-agents, en toont aan dat zelfs de meest geavanceerde modellen moeite hebben met visueel redeneren tijdens het zoekproces.

Zhengbo Zhang, Jinbo Su, Zhaowen Zhou, Changtao Miao, Yuhan Hong, Qimeng Wu, Yumeng Liu, Feier Wu, Yihe Tian, Yuhao Liang, Zitong Shan, Wanke Xia, Yi-Fan Zhang, Bo Zhang, Zhe Li, Shiming Xiang, Ying Yan2026-03-18🤖 cs.AI

Attention-guided Evidence Grounding for Spoken Question Answering

Dit paper introduceert AEG, een end-to-end framework voor gesproken vraagbeantwoording dat door middel van een nieuwe trainingsparadigma (LFE) de interne cross-modale aandacht van SpeechLLMs optimaliseert om bewijsmateriaal nauwkeuriger te lokaliseren, wat resulteert in minder hallucinaties en een aanzienlijke vermindering van de inferentielatentie ten opzichte van bestaande cascade-systemen.

Ke Yang, Bolin Chen, Yuejie Li, Yueying Hua, Jianhao Nie, Yueping He, Bowen Li, Chengjun Mao2026-03-18💬 cs.CL

A Human-Centred Architecture for Large Language Models-Cognitive Assistants in Manufacturing within Quality Management Systems

Dit artikel presenteert een mensgericht, component-gebaseerd softwarearchitectuurontwerp voor de integratie van Large Language Models als cognitieve assistenten in kwaliteitsmanagementsystemen voor de maakindustrie, dat is gevalideerd door expertfocusgroepen en gericht is op flexibiliteit, schaalbaarheid en procesverbetering.

Marcos Galdino, Johanna Grahl, Tobias Hamann, Anas Abdelrazeq, Ingrid Isenhardt2026-03-18🤖 cs.AI

Automated identification of Ichneumonoidea wasps via YOLO-based deep learning: Integrating HiresCam for Explainable AI

Deze studie presenteert een YOLO-gebaseerd deep learning-systeem geïntegreerd met HiResCAM voor de nauwkeurige en interpreteerbare automatische identificatie van Ichneumonoidea-wespen op basis van hoge-resolutie beelden, wat de taxonomische analyse versnelt en transparant maakt.

Joao Manoel Herrera Pinheiro, Gabriela Do Nascimento Herrera, Alvaro Doria Dos Santos, Luciana Bueno Dos Reis Fernandes, Ricardo V. Godoy, Eduardo A. B. Almeida, Helena Carolina Onody, Marcelo Andrade Da Costa Vieira, Angelica Maria Penteado-Dias, Marcelo Becker2026-03-18🤖 cs.LG

Toward Experimentation-as-a-Service in 5G/6G: The Plaza6G Prototype for AI-Assisted Trials

Dit artikel introduceert Plaza6G, het eerste operationele Experiment-as-a-Service-platform dat cloudresources en 5G/6G-wireless-infrastructuur verenigt en experimenten via een door een LLM-aangedreven assistent in natuurlijke taal mogelijk maakt, waardoor geautomatiseerde CI/CD-integratie en interactieve over-the-air-tests met hoge reproduceerbaarheid worden gerealiseerd.

Sergio Barrachina-Muñoz, Marc Carrascosa-Zamacois, Horacio Bleda, Umair Riaz, Yasir Maqsood, Xavier Calle, Selva Vía, Miquel Payaró, Josep Mangues-Bafalluy2026-03-18🤖 cs.AI

D3D^3-RSMDE: 40×\times Faster and High-Fidelity Remote Sensing Monocular Depth Estimation

Het paper introduceert D3D^3-RSMDE, een efficiënt framework voor monokulaire dieptebepaling op afbeeldingen van aardobservatie dat een ViT-gebaseerde structuurvoorspelling combineert met een lichtgewicht verfijning via diffusiemodellen om een 40-voudige versnelling te bereiken zonder in te leveren op de perceptuele kwaliteit.

Ruizhi Wang, Weihan Li, Zunlei Feng, Haofei Zhang, Mingli Song, Jiayu Wang, Jie Song, Li Sun2026-03-18🤖 cs.AI

FactorEngine: A Program-level Knowledge-Infused Factor Mining Framework for Quantitative Investment

FactorEngine introduceert een nieuw raamwerk voor kwantitatieve belegging dat door het combineren van Turing-volledige code, LLM-gestuurde zoekstrategieën en een kennisverrijkte bootstrapping-module, stabielere en beter interpreteerbare alpha-factoren genereert dan bestaande methoden.

Qinhong Lin, Ruitao Feng, Yinglun Feng, Zhenxin Huang, Yukun Chen, Zhongliang Yang, Linna Zhou, Binjie Fei, Jiaqi Liu, Yu Li2026-03-18🤖 cs.AI

DynamicGate MLP Conditional Computation via Learned Structural Dropout and Input Dependent Gating for Functional Plasticity

Dit paper introduceert DynamicGate-MLP, een raamwerk dat dropout-regulering en input-afhankelijke conditionele berekening combineert door geleerde poorten te gebruiken om de uitvoering van neurale eenheden dynamisch aan te passen aan de invoer, waardoor de rekenefficiëntie wordt verbeterd zonder in te leveren op prestaties.

Yong Il Choi2026-03-18✓ Author reviewed 🤖 cs.LG

Age Predictors Through the Lens of Generalization, Bias Mitigation, and Interpretability: Reflections on Causal Implications

Dit artikel onderzoekt hoe het leren van invariante representaties met betrekking tot exogene attributen zoals ras en geslacht de generalisatie van leeftijdsvoorspellers verbetert, bias vermindert en interpretatie mogelijk maakt via een op adversariaal leren gebaseerd neuronaal netwerk, terwijl het ook de beperkingen van causale conclusies uit puur voorspellende modellen benadrukt.

Debdas Paul, Elisa Ferrari, Irene Gravili, Alessandro Cellerino2026-03-18🤖 cs.LG