ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement

Il paper presenta ECLARE, un metodo di super-risoluzione efficiente e auto-apprendente che migliora la risoluzione anisotropa dei volumi MR clinici stimando il profilo della slice e apprendendo direttamente dai dati acquisiti, superando così le limitazioni delle tecniche esistenti senza subire problemi di spostamento di dominio.

Samuel W. Remedios, Shuwen Wei, Shuo Han, Jinwei Zhang, Aaron Carass, Kurt G. Schilling, Dzung L. Pham, Jerry L. Prince, Blake E. DeweyMon, 09 Ma💻 cs

Multivariate Fields of Experts for Convergent Image Reconstruction

Il paper introduce i "Multivariate Fields of Experts", un nuovo framework per l'apprendimento di priori delle immagini che, grazie a funzioni potenziali multivariate basate su involucri di Moreau, supera i modelli univariati e si avvicina alle prestazioni dei metodi deep learning offrendo al contempo maggiore velocità, efficienza dei parametri, interpretabilità e garanzie teoriche di convergenza per vari problemi inversi di ricostruzione.

Stanislas Ducotterd, Michael UnserMon, 09 Ma🤖 cs.LG

SAAIPAA: Optimizing aspect-angles-invariant physical adversarial attacks on SAR target recognition models

Il paper propone SAAIPAA, un framework per attacchi avversari fisici su modelli di riconoscimento automatico di bersagli SAR che, grazie a una modellazione fisica rigorosa, determina posizioni e orientamenti ottimali di riflettori per ingannare i sistemi di classificazione indipendentemente dagli angoli di aspetto della piattaforma, raggiungendo tassi di successo fino al 99,2% in scenari white-box.

Isar Lemeire, Yee Wei Law, Sang-Heon Lee, William Meakin, Tat-Jun ChinMon, 09 Ma⚡ eess

Learning Latent Transmission and Glare Maps for Lens Veiling Glare Removal

Il paper presenta VeilGen, un modello generativo non supervisionato che stima mappe latenti di trasmissione e bagliore per sintetizzare dati realistici, e DeVeiler, una rete di restauro che utilizza queste mappe per rimuovere efficacemente il bagliore velante dai sistemi ottici semplificati.

Xiaolong Qian, Qi Jiang, Lei Sun, Zongxi Yu, Kailun Yang, Peixuan Wu, Jiacheng Zhou, Yao Gao, Yaoguang Ma, Ming-Hsuan Yang, Kaiwei WangMon, 09 Ma🔬 physics.optics

In-batch Relational Features Enhance Precision in An Unsupervised Medical Anomaly Detection Task

Questo studio propone un metodo di rilevamento delle anomalie mediche non supervisionato che, integrando le somiglianze contestuali all'interno di un batch tramite ipergrafi e convoluzioni grafiche, riduce significativamente i falsi positivi distinguendo meglio le variazioni anatomiche normali dalle patologie.

P. Bilha Githinji, Xi Yuan, Ijaz Gul, Lian Zhang, Jinhao Xu, Zhenglin Chen, Peiwu Qin, Dongmei YuMon, 09 Ma🧬 q-bio

Clinical-Injection Transformer with Domain-Adapted MAE for Lupus Nephritis Prognosis Prediction

Questo studio propone il primo quadro computazionale multimodale per la prognosi della nefrite lupica pediatrica, che combina dati clinici e istopatologici tramite un Transformer a iniezione clinica e un MAE adattato al dominio, ottenendo un'accuratezza del 90,1% nella previsione della risposta al trattamento utilizzando solo biopsie colorate con PAS.

Yuewen Huang, Zhitao Ye, Guangnan Feng, Fudan Zheng, Xia Gao, Yutong LuMon, 09 Ma🤖 cs.LG

Gabor Primitives for Accelerated Cardiac Cine MRI Reconstruction

Il paper propone l'uso di primitive di Gabor, che modulano involucri gaussiani con esponenziali complessi per rappresentare efficacemente sia le strutture lisce che i confini netti, combinati con una decomposizione temporale a basso rango per ricostruire immagini di risonanza magnetica cardiaca cine accelerate, superando le prestazioni dei metodi esistenti come la compressione sensoriale e le rappresentazioni neurali implicite.

Wenqi Huang, Veronika Spieker, Nil Stolt-Ansó, Natascha Niessen, Maik Dannecker, Sevgi Gokce Kafali, Sila Kurugol, Julia A. Schnabel, Daniel RueckertMon, 09 Ma💻 cs

Interpretable Motion Artificat Detection in structural Brain MRI

Questo lavoro propone un framework leggero e interpretabile basato su estensioni tridimensionali dell'istogramma discriminativo del gradiente (DHoGM) per rilevare in modo efficiente e robusto gli artefatti da movimento nelle risonanze magnetiche cerebrali strutturali, ottenendo elevate prestazioni di generalizzazione su dati non visti senza richiedere costosi pre-processing.

Naveetha Nithianandam, Prabhjot Kaur, Anil Kumar SaoMon, 09 Ma💻 cs

Architectural Unification for Polarimetric Imaging Across Multiple Degradations

Questo lavoro propone un framework architetturale unificato per l'imaging polarimetrico che, attraverso un elaborazione congiunta singola fase nei domini dell'immagine e di Stokes, supera le limitazioni dei metodi esistenti ottenendo prestazioni all'avanguardia nel recupero di parametri fisici coerenti da osservazioni degradate da rumore, sfocatura da movimento e artefatti di mosaico.

Chu Zhou, Yufei Han, Junda Liao, Linrui Dai, Wangze Xu, Art Subpa-Asa, Heng Guo, Boxin Shi, Imari SatoMon, 09 Ma💻 cs

Technical Report: Automated Optical Inspection of Surgical Instruments

Questo rapporto presenta un sistema di ispezione ottica automatizzata basato su architetture di deep learning (YOLOv8, ResNet-152 ed EfficientNet-b4) e un nuovo dataset di 4.414 immagini, sviluppato in collaborazione con leader dell'industria di Sialkot per rilevare difetti critici negli strumenti chirurgici pakistani e garantire la sicurezza dei pazienti.

Zunaira Shafqat, Atif Aftab Ahmed Jilani, Qurrat Ul AinMon, 09 Ma🤖 cs.AI

NOVA: Next-step Open-Vocabulary Autoregression for 3D Multi-Object Tracking in Autonomous Driving

Il paper introduce NOVA, un nuovo paradigma di autoregressione open-vocabulary che sfrutta i modelli linguistici su larga scala per trasformare il tracciamento 3D di oggetti multipli in un compito di completamento di sequenze spaziotemporali, ottenendo prestazioni superiori nel tracciamento di categorie sconosciute rispetto ai metodi tradizionali.

Kai Luo, Xu Wang, Rui Fan, Kailun YangMon, 09 Ma💻 cs

Can we Trust Unreliable Voxels? Exploring 3D Semantic Occupancy Prediction under Label Noise

Questo lavoro introduce il benchmark OccNL e il framework DPR-Occ per affrontare la previsione dell'occupazione semantica 3D in presenza di rumore di etichetta, dimostrando che le strategie esistenti falliscono in spazi voxel sparsi e proponendo un metodo innovativo basato sul ragionamento su etichette parziali che mantiene prestazioni elevate anche con un rumore del 90%.

Wenxin Li, Kunyu Peng, Di Wen, Junwei Zheng, Jiale Wei, Mengfei Duan, Yuheng Zhang, Rui Fan, Kailun YangMon, 09 Ma💻 cs

AI End-to-End Radiation Treatment Planning Under One Second

Il paper presenta AIRT, un framework di deep learning end-to-end che genera piani di radioterapia VMAT per il cancro alla prostata in meno di un secondo, dimostrando una qualità non inferiore ai piani standard prodotti da RapidPlan Eclipse.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin ComaniciuMon, 09 Ma🤖 cs.AI