Unsupervised Causal Prototypical Networks for De-biased Interpretable Dermoscopy Diagnosis

Il paper propone CausalProto, una rete prototipale causale non supervisionata che, sfruttando un modello causale strutturale e un collo di bottiglia informativo, disaccoppia le caratteristiche patologiche dai fattori ambientali confondenti nelle immagini dermoscopiche per ottenere diagnosi più accurate, interpretabili e prive di bias senza compromettere le prestazioni.

Junhao Jia, Yueyi Wu, Huangwei Chen + 4 more2026-03-02⚡ eess

Breaking the Data Barrier: Robust Few-Shot 3D Vessel Segmentation using Foundation Models

Il paper propone un nuovo framework che adatta il modello fondazionale DINOv3 per la segmentazione vascolare 3D in regime few-shot, ottenendo prestazioni superiori rispetto agli stati dell'arte su dataset in-domain e out-of-distribution grazie a un adattatore 3D leggero e a strategie di aggregazione multi-scala che garantiscono coerenza volumetrica con dati di addestramento limitati.

Kirato Yoshihara, Yohei Sugawara, Yuta Tokuoka + 1 more2026-03-02⚡ eess

BiM-GeoAttn-Net: Linear-Time Depth Modeling with Geometry-Aware Attention for 3D Aortic Dissection CTA Segmentation

Il paper presenta BiM-GeoAttn-Net, un framework leggero che combina la modellazione dello stato spaziale bidirezionale in profondità con un'attenzione vascolare consapevole della geometria per migliorare l'accurata segmentazione 3D delle dissezioni aortiche nelle immagini CTA, ottenendo prestazioni superiori rispetto alle tecniche esistenti.

Yuan Zhang, Lei Liu, Jialin Zhang + 3 more2026-03-02⚡ eess

Action-Geometry Prediction with 3D Geometric Prior for Bimanual Manipulation

Il paper propone un framework per la manipolazione bimanuale che sfrutta un modello fondazionale geometrico 3D pre-addestrato per prevedere simultaneamente azioni e l'evoluzione della scena 3D partendo solo da immagini RGB, superando così i limiti dei metodi basati su features 2D o nuvole di punti esplicite e ottenendo prestazioni superiori sia in simulazione che nel mondo reale.

Chongyang Xu, Haipeng Li, Shen Cheng + 4 more2026-03-02💻 cs

Revisiting Integration of Image and Metadata for DICOM Series Classification: Cross-Attention and Dictionary Learning

Il paper propone un framework multimodale end-to-end che integra immagini e metadati DICOM mediante meccanismi di attenzione incrociata e apprendimento dizionario per classificare serie di immagini mediche in modo robusto, superando le sfide legate all'eterogeneità dei dati e alla sparsità dei metadati senza richiedere imputazione.

Tuan Truong, Melanie Dohmen, Sara Lorio + 1 more2026-03-02⚡ eess

Open-Vocabulary Semantic Segmentation in Remote Sensing via Hierarchical Attention Masking and Model Composition

Il paper propone ReSeg-CLIP, un metodo senza addestramento per la segmentazione semantica open-vocabulary in ambito di telerilevamento che combina un meccanismo di mascheramento gerarchico basato su SAM con una composizione di modelli CLIP specifici per il settore, ottenendo risultati all'avanguardia su tre benchmark.

Mohammadreza Heidarianbaei, Mareike Dorozynski, Hubert Kanyamahanga + 2 more2026-03-02💻 cs

Bandwidth-adaptive Cloud-Assisted 360-Degree 3D Perception for Autonomous Vehicles

Il paper propone un sistema ibrido cloud-veicolo che, sfruttando la comunicazione V2X e modelli transformer per la fusione dei dati sensoriali, adatta dinamicamente il carico computazionale e la quantizzazione delle feature per garantire una percezione 3D a 360 gradi con latenza ridotta e maggiore accuratezza rispetto alle soluzioni puramente onboard.

Faisal Hawladera, Rui Meireles, Gamal Elghazaly + 2 more2026-03-02🤖 cs.LG