DLRMamba: Distilling Low-Rank Mamba for Edge Multispectral Fusion Object Detection

Het paper introduceert DLRMamba, een efficiënte methode voor objectdetectie in multispectrale beelden op randapparatuur die parameterredundantie in Mamba-modellen oplost door middel van een laag-rang 2D selectieve scan en structurele distillatie, waardoor een superieur evenwicht tussen rekenefficiëntie en detectienauwkeurigheid wordt bereikt.

Qianqian Zhang, Leon Tabaro, Ahmed M. Abdelmoniem, Junshe An2026-03-10💻 cs

Small Target Detection Based on Mask-Enhanced Attention Fusion of Visible and Infrared Remote Sensing Images

Dit artikel presenteert ESM-YOLO+, een lichtgewicht netwerk voor de detectie van kleine objecten in zichtbare en infrarood afbeeldingen dat gebruikmaakt van een masker-gebaseerde fusiemodule en structurele versterking tijdens training om de nauwkeurigheid te maximaliseren terwijl de modelcomplexiteit aanzienlijk wordt verlaagd.

Qianqian Zhang, Xiaolong Jia, Ahmed M. Abdelmoniem, Li Zhou, Junshe An2026-03-10💻 cs

Extracting and analyzing 3D histomorphometric features related to perineural and lymphovascular invasion in prostate cancer

Deze studie presenteert een analytische pijplijn die 3D-histomorfometrische kenmerken van perineurale en lymfovaskulaire invasie in prostaatkanker extrahert uit optisch opgehelderde weefselmonsters, en toont aan dat deze 3D-kenmerken een betere voorspelling van biochemische recidieven bieden dan traditionele 2D-metingen.

Sarah S. L. Chow, Rui Wang, Robert B. Serafin, Yujie Zhao, Elena Baraznenok, Xavier Farré, Jennifer Salguero-Lopez, Gan Gao, Huai-Ching Hsieh, Lawrence D. True, Priti Lal, Anant Madabhushi, Jonathan T. C. Liu2026-03-10💻 cs

Virtual Intraoperative CT (viCT): Sequential Anatomic Updates for Modeling Tissue Resection Throughout Endoscopic Sinus Surgery

Dit artikel introduceert viCT, een methode die monocular endoscopische video gebruikt om een virtuele intraoperatieve CT te genereren die de anatomie tijdens endoscopische sinusoperaties dynamisch bijwerkt, waardoor de beperkingen van statische preoperatieve beelden worden overwonnen met submillimeter nauwkeurigheid.

Nicole M. Gunderson, Graham J. Harris, Jeremy S. Ruthberg, Pengcheng Chen, Di Mao, Randall A. Bly, Waleed M. Abuzeid, Eric J. Seibel2026-03-10💻 cs

Conditional Unbalanced Optimal Transport Maps: An Outlier-Robust Framework for Conditional Generative Modeling

Dit paper introduceert Conditional Unbalanced Optimal Transport (CUOT), een robuust raamwerk voor conditionele generatieve modellering dat de gevoeligheid voor uitbijters in klassieke methoden oplost door de distributievastleggingsbeperkingen te versoepelen via Csiszár-divergentiestraffen, wat resulteert in een efficiënt en nauwkeurig model voor het genereren van data.

Jiwoo Yoon, Kyumin Choi, Jaewoong Choi2026-03-10🤖 cs.LG

Optimizing Multi-Modal Models for Image-Based Shape Retrieval: The Role of Pre-Alignment and Hard Contrastive Learning

Dit artikel presenteert een methode voor beeldgebaseerde vormretrieval die gebruikmaakt van vooraf uitgelijnde multi-modale encoders en een hard contrastief verlies om state-of-the-art prestaties te bereiken zonder dat view-synthese of hertraining op de doel-database nodig is.

Paul Julius Kühn, Cedric Spengler, Michael Weinmann, Arjan Kuijper, Saptarshi Neil Sinha2026-03-10💻 cs

Perception-Aware Multimodal Spatial Reasoning from Monocular Images

Dit paper introduceert een perceptiebewust multimodaal redeneringsframework dat Vision-Language Models versterkt met object-gerichte grounding via visuele referentietokens en een Multimodal Chain-of-Thought-dataset, waardoor aanzienlijke verbeteringen worden behaald in ruimtelijk redeneren uit monoculaire beelden voor autonoom rijden.

Yanchun Cheng, Rundong Wang, Xulei Yang, Alok Prakash, Daniela Rus, Marcelo H Ang Jr, ShiJie Li2026-03-10💻 cs

ADAS-TO: A Large-Scale Multimodal Naturalistic Dataset and Empirical Characterization of Human Takeovers during ADAS Engagement

Dit paper introduceert ADAS-TO, het eerste grote, openbare multimodale dataset dat zich richt op natuurlijke overnames van ADAS naar handmatige besturing, en biedt empirische inzichten in de dynamiek van kritieke situaties die aantonen dat visuele waarschuwingen vaak eerder mogelijk zijn dan kinematische triggers.

Yuhang Wang, Yiyao Xu, Jingran Sun, Hao Zhou2026-03-10💻 cs