UniGround: Universal 3D Visual Grounding via Training-Free Scene Parsing

Dit paper introduceert UniGround, een training-vrije methode voor universele 3D-visual grounding die door middel van visuele en geometrische redenering objecten in willekeurige 3D-scènes lokaliseert zonder afhankelijk te zijn van vooraf getrainde modellen, waardoor robuustheid en generalisatie naar ongeziene ruimtelijke relaties en domeinen worden bereikt.

Jiaxi Zhang, Yunheng Wang, Wei Lu, Taowen Wang, Weisheng Xu, Shuning Zhang, Yixiao Feng, Yuetong Fang, Renjing Xu2026-03-10💻 cs

MERLIN: Building Low-SNR Robust Multimodal LLMs for Electromagnetic Signals

Dit paper introduceert MERLIN, een robuust multimodaal groot taalmodel voor elektromagnetische signalen dat de uitdagingen van data-schaarste, benchmark-tekort en lage signaal-ruisverhoudingen aanpakt door middel van de nieuwe datasets EM-100k, de benchmark EM-Bench en een geavanceerd trainingsframework.

Junyu Shen, Zhendong She, Chenghanyu Zhang, Yuchuang Sun, Luqing Luo, Dingwei Tan, Zonghao Guo, Bo Guo, Zehua Han, Wupeng Xie, Yaxin Mu, Peng Zhang, Peipei Li, Fengxiang Wang, Yangang Sun, Maosong Sun2026-03-10💻 cs

ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection

Dit paper introduceert ALOOD, een nieuwe methode die taalrepresentaties van een vision-language model gebruikt om LiDAR-gebaseerde 3D-objectdetectiesystemen in staat te stellen onbekende (out-of-distribution) objecten te herkennen als een zero-shot classificatietask, waardoor de veiligheidsrisico's van verkeerd vertrouwen in autonome rijsystemen worden verminderd.

Michael Kösel, Marcel Schreiber, Michael Ulrich, Claudius Gläser, Klaus Dietmayer2026-03-10🤖 cs.LG

MM-TS: Multi-Modal Temperature and Margin Schedules for Contrastive Learning with Long-Tail Data

Dit paper introduceert MM-TS, een methode voor multi-modale contrastieve learning die dynamische temperatuur- en margeschema's gebruikt om de prestaties op langstaartdata te verbeteren en InfoNCE-loss met max-margin-objectieven te verenigen, wat leidt tot nieuwe state-of-the-art resultaten op diverse beeld- en video-taalkundige datasets.

Siarhei Sheludzko, Dhimitrios Duka, Bernt Schiele, Hilde Kuehne, Anna Kukleva2026-03-10💻 cs

Alignment-Aware and Reliability-Gated Multimodal Fusion for Unmanned Aerial Vehicle Detection Across Heterogeneous Thermal-Visual Sensors

Deze studie introduceert twee nieuwe fusiestrategieën, RGIF en RGMAF, die registratiebewustzijn en betrouwbaarheidsgebaseerde aandacht gebruiken om de prestaties van UAV-detectie in heterogene thermische en visuele sensoren aanzienlijk te verbeteren.

Ishrat Jahan, Molla E Majid, M Murugappan, Muhammad E. H. Chowdhury, N. B. Prakash, Saad Bin Abul Kashem, Balamurugan Balusamy, Amith Khandakar2026-03-10💻 cs

Exploring Deep Learning and Ultra-Widefield Imaging for Diabetic Retinopathy and Macular Edema

Dit onderzoek toont aan dat state-of-the-art deep learning-modellen, waaronder vision transformers en foundation modellen, in combinatie met ultra-widefield imaging en frequentiedomeinrepresentaties, zeer effectief zijn voor het beoordelen van beeldkwaliteit, het detecteren van referabele diabetische retinopathie en diabetisch maculair oedeem, waarbij feature-level fusion en Grad-CAM-analyse de robuustheid en uitlegbaarheid verder verbeteren.

Pablo Jimenez-Lizcano, Sergio Romero-Tapiador, Ruben Tolosana, Aythami Morales, Guillermo González de Rivera, Ruben Vera-Rodriguez, Julian Fierrez2026-03-10💻 cs

DynamicVGGT: Learning Dynamic Point Maps for 4D Scene Reconstruction in Autonomous Driving

Dit paper introduceert DynamicVGGT, een uniek feed-forward framework dat VGGT uitbreidt tot dynamische 4D-scèneherconstructie voor autonoom rijden door het gezamenlijk voorspellen van puntkaarten en het gebruik van motion-aware temporal attention en dynamische 3D Gaussian Splatting voor nauwkeurige bewegingsmodellering.

Zhuolin He, Jing Li, Guanghao Li, Xiaolei Chen, Jiacheng Tang, Siyang Zhang, Zhounan Jin, Feipeng Cai, Bin Li, Jian Pu, Jia Cai, Xiangyang Xue2026-03-10💻 cs