Inference-Time Dynamic Modality Selection for Incomplete Multimodal Classification

Il paper propone DyMo, un nuovo framework di selezione dinamica delle modalità a tempo di inferenza che risolve il dilemma tra scarto e imputazione dei dati multimodali incompleti massimizzando le informazioni rilevanti per il compito tramite una funzione di ricompensa basata sulla perdita del task, ottenendo prestazioni superiori rispetto agli stati dell'arte su diversi dataset.

Siyi Du, Xinzhe Luo, Declan P. O'Regan + 1 more2026-02-24💻 cs

Towards Segmenting the Invisible: An End-to-End Registration and Segmentation Framework for Weakly Supervised Tumour Analysis

Questo studio presenta un framework ibrido di registrazione e segmentazione per l'analisi di tumori epatici in regime di supervisione debole, dimostrando che, sebbene sia possibile trasferire etichette tra MRI e CT per anatomie visibili, la segmentazione di patologie "invisibili" nel CT rimane una sfida aperta a causa dell'assenza di caratteristiche discriminative.

Budhaditya Mukhopadhyay, Chirag Mandal, Pavan Tummala + 3 more2026-02-24⚡ eess

Zero-shot Multi-Contrast Brain MRI Registration by Intensity Randomizing T1-weighted MRI (LUMIR25)

Questo lavoro presenta LUMIR25, un metodo di registrazione zero-shot che ha ottenuto il primo posto nella sfida Learn2Reg 2025, combinando induttivi bias specifici per la registrazione con strategie di randomizzazione dell'intensità e ottimizzazione istanza-specifica per generalizzare con successo la registrazione T1-T1 a diversi contrasti e domini senza sintesi esplicita delle immagini.

Hengjie Liu, Yimeng Dou, Di Xu + 3 more2026-02-24⚡ eess

Energy-Efficient Fast Object Detection on Edge Devices for IoT Systems

Questo articolo presenta un algoritmo di rilevamento degli oggetti leggero ed efficiente dal punto di vista energetico per i sistemi IoT, basato sul metodo della differenza di frame e ottimizzato su dispositivi edge, che supera significativamente i metodi end-to-end in termini di accuratezza, efficienza e latenza, specialmente per oggetti in rapido movimento come treni e aerei.

Mas Nurul Achmadiah, Afaroj Ahamad, Chi-Chia Sun + 1 more2026-02-24💻 cs

Time2General: Learning Spatiotemporal Invariant Representations for Domain-Generalization Video Semantic Segmentation

Il paper presenta Time2General, un framework per la segmentazione semantica video generalizzabile a nuovi domini che utilizza un decoder di memoria spaziotemporale e una nuova funzione di perdita per garantire stabilità temporale e robustezza alle variazioni di campionamento, eliminando il flicker senza necessità di adattamento al test.

Siyu Chen, Ting Han, Haoling Huang + 5 more2026-02-24💻 cs

A Novel Public Dataset for Strawberry (Fragaria x ananassa) Ripeness Detection and Comparative Evaluation of YOLO-Based Models

Questo studio presenta un nuovo dataset pubblico per il rilevamento della maturità delle fragole e valuta le prestazioni comparative dei modelli YOLOv8, YOLOv9 e YOLO11, dimostrando che i modelli di piccole e medie dimensioni offrono un equilibrio ottimale per le applicazioni di agricoltura intelligente.

Mustafa Yurdakul, Zeynep Sena Bastug, Ali Emre Gok + 1 more2026-02-24💻 cs