Digital-Twin Losses for Lane-Compliant Trajectory Prediction at Urban Intersections

Dit artikel presenteert een digitale-tweelinggestuurde V2X-baanvoorspellingspipeline voor stedelijke kruispunten die, door middel van een innovatieve 'twin loss' naast de standaard MSE-loss, de voorspellingen van multi-agent bewegingen significant veiliger maakt door verkeersregels en botsingsvermijding te integreren zonder de nauwkeurigheid of real-time prestaties te compromitteren.

Kuo-Yi Chao, Erik Leo Haß, Melina Gegg, Jiajie Zhang, Ralph Raßhofer, Alois Christian Knoll2026-03-09💻 cs

AutothinkRAG: Complexity-Aware Control of Retrieval-Augmented Reasoning for Image-Text Interaction

Het paper introduceert AutoThinkRAG, een framework dat de prestaties van Vision-Language Models bij complexe documentvraag-antwoordtaken verbetert door query-complexiteit te routeren en visuele interpretatie te ontkoppelen van logische redenering, wat leidt tot state-of-the-art resultaten tegen lagere kosten.

Jiashu Yang, Chi Zhang, Abudukelimu Wuerkaixi, Xuxin Cheng, Cao Liu, Ke Zeng, Xu Jia, Xunliang Cai2026-03-09💻 cs

From Decoupled to Coupled: Robustness Verification for Learning-based Keypoint Detection with Joint Specifications

Deze paper introduceert het eerste gekoppelde robuustheidsverificatiekader voor heatmaps gebaseerde sleutelpuntdetectie dat, in tegenstelling tot eerdere onafhankelijke benaderingen, de gezamenlijke afwijking van alle sleutelpunten garandeert door het verificatieprobleem te formuleren als een falsificatieopdracht met behulp van gemengd-geheelgetallige lineaire programmering.

Xusheng Luo, Changliu Liu2026-03-09🤖 cs.LG

DreamCAD: Scaling Multi-modal CAD Generation using Differentiable Parametric Surfaces

DreamCAD is een multi-modale generatieve framework dat schaalbaar en bewerkbare CAD-modellen (BRep) produceert vanuit punt-supervisie zonder specifieke CAD-annotaties, door parametrische oppervlakken te combineren met differentieerbare tessellatie en het nieuwe CADCap-1M dataset.

Mohammad Sadil Khan, Muhammad Usama, Rolandos Alexandros Potamias, Didier Stricker, Muhammad Zeshan Afzal, Jiankang Deng, Ismail Elezi2026-03-09🤖 cs.AI

Adversarial Batch Representation Augmentation for Batch Correction in High-Content Cellular Screening

Dit paper introduceert ABRA, een nieuwe methode voor batchcorrectie in high-content screening die bio-batch-effecten aanpakt als een domein-generalisatieprobleem door middel van een adversariaal trainingsframework dat statistische fluctuaties simuleert en zo de generalisatie van diepe leermodellen op onzichtbare data verbetert.

Lei Tong, Xujing Yao, Adam Corrigan, Long Chen, Navin Rathna Kumar, Kerry Hallbrook, Jonathan Orme, Yinhai Wang, Huiyu Zhou2026-03-09🤖 cs.AI

Rethinking Concept Bottleneck Models: From Pitfalls to Solutions

Dit artikel introduceert CBM-Suite, een methodologisch kader dat de fundamentele beperkingen van Concept Bottleneck Models aanpakt door een entropie-maatstaf voor conceptrelevantie, een niet-lineaire laag om het 'lineariteitsprobleem' op te lossen, en distillatie voor nauwkeurigheidsverbetering, waardoor nauwkeurigere en interpreteerbaarder modellen ontstaan.

Merve Tapli, Quentin Bouniot, Wolfgang Stammer, Zeynep Akata, Emre Akbas2026-03-09💻 cs

Keeping the Evidence Chain: Semantic Evidence Allocation for Training-Free Token Pruning in Video Temporal Grounding

Het artikel introduceert SemVID, een trainingsvrij raamwerk voor semantische toewijzing van bewijsmateriaal dat door het behoud van object-, bewegings- en contexttokens de nauwkeurigheid van video-temporale gronding behoudt terwijl het het aantal visuele tokens drastisch reduceert en de verwerkingssnelheid aanzienlijk verbetert.

Jiaqi Li, Shuntian Zheng, Yixian Shen, Jia-Hong Huang, Xiaoman Lu, Minzhe Ni, Yu Guan2026-03-09💻 cs

Gabor Primitives for Accelerated Cardiac Cine MRI Reconstruction

Dit artikel introduceert Gabor-primitieven voor versnelde reconstructie van cardiale cine-MRI, die door het moduleren van Gaussische enveloppen met complexe exponentiële functies en het ontleden van spatiotemporele redundantie, een compacte en fysisch interpreteerbare representatie bieden die bestaande methoden zoals Compressed Sensing en Implicit Neural Representations overtreft.

Wenqi Huang, Veronika Spieker, Nil Stolt-Ansó, Natascha Niessen, Maik Dannecker, Sevgi Gokce Kafali, Sila Kurugol, Julia A. Schnabel, Daniel Rueckert2026-03-09💻 cs

MultiHaystack: Benchmarking Multimodal Retrieval and Reasoning over 40K Images, Videos, and Documents

Het paper introduceert MultiHaystack, een nieuw benchmark met meer dan 46.000 multimodale documenten, afbeeldingen en video's om de prestaties van multimodale grote taalmodellen te evalueren bij het ophalen van relevante bewijsstukken uit grote verzamelingen en het redeneren daarover, waarbij blijkt dat de huidige modellen sterk presteren bij gegeven bewijs maar aanzienlijk falen bij het zelf vinden van dat bewijs.

Dannong Xu, Zhongyu Yang, Jun Chen, Yingfang Yuan, Ming Hu, Lei Sun, Luc Van Gool, Danda Pani Paudel, Chun-Mei Feng2026-03-09💻 cs