RT-RMOT: A Dataset and Framework for RGB-Thermal Referring Multi-Object Tracking

Gli autori propongono RT-RMOT, un nuovo compito di tracciamento multi-oggetto referenziato che fonde dati RGB e termici, supportato dal primo dataset multimodale RefRT e dal framework RTrack basato su un modello linguistico multimodale ottimizzato con strategie di apprendimento per rinforzo per garantire prestazioni robuste in condizioni di scarsa visibilità.

Yanqiu Yu, Zhifan Jin, Sijia Chen + 4 more2026-02-26💻 cs

Lumosaic: Hyperspectral Video via Active Illumination and Coded-Exposure Pixels

Il paper presenta Lumosaic, un sistema attivo e compatto per la cattura di video iperspettrali in tempo reale che combina un array LED a banda stretta con una fotocamera a pixel a esposizione codificata e un processo di ricostruzione basato sull'apprendimento per ottenere ricostruzioni spettralmente accurate e temporalmente coerenti anche in presenza di movimento.

Dhruv Verma, Andrew Qiu, Roberto Rangel + 8 more2026-02-26⚡ eess

Mixed Magnification Aggregation for Generalizable Region-Level Representations in Computational Pathology

Il paper propone un nuovo encoder di aggregazione a livello di regione che fonde rappresentazioni di tile a diverse magnificazioni tramite un preaddestramento con mascheramento, migliorando le prestazioni predittive per vari biomarcatori tumorali grazie a una migliore cattura del contesto spaziale e multi-risoluzione nelle immagini patologiche.

Eric Zimmermann, Julian Viret, Michal Zelechowski + 7 more2026-02-26💻 cs

Off-The-Shelf Image-to-Image Models Are All You Need To Defeat Image Protection Schemes

Questo studio dimostra che i modelli generativi immagine-su-immagine pronti all'uso possono essere riproposti come denoiser generici tramite semplici prompt testuali per aggirare con successo e superare gli attacchi esistenti una vasta gamma di schemi di protezione delle immagini, rivelando così una vulnerabilità critica che offre una falsa sicurezza.

Xavier Pleimling, Sifat Muhammad Abdullah, Gunjan Balde + 4 more2026-02-26🤖 cs.AI

Interpretable Medical Image Classification using Prototype Learning and Privileged Information

Il lavoro propone Proto-Caps, un modello innovativo che combina reti a capsule, apprendimento per prototipi e informazioni privilegiate per ottenere una classificazione interpretabile e ad alte prestazioni delle immagini mediche, dimostrando sul dataset LIDC-IDRI una precisione superiore del 6% rispetto ai modelli di riferimento mantenendo al contempo la capacità di fornire ragionamenti basati su casi visivamente verificabili.

Luisa Gallee, Meinrad Beer, Michael Goetz2026-02-25🤖 cs.AI