eess.IV articoli | Gist.Science

ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement

Il paper presenta ECLARE, un metodo di super-risoluzione efficiente e auto-apprendente che migliora la risoluzione anisotropa dei volumi MR clinici stimando il profilo della slice e apprendendo direttamente dai dati acquisiti, superando così le limitazioni delle tecniche esistenti senza subire problemi di spostamento di dominio.

Samuel W. Remedios, Shuwen Wei, Shuo Han, Jinwei Zhang, Aaron Carass, Kurt G. Schilling, Dzung L. Pham, Jerry L. Prince, Blake E. DeweyMon, 09 Ma💻 cs

Evaluating quality metrics through the lenses of psychophysical measurements of low-level vision

Questo articolo introduce un nuovo set di test basati su misurazioni psicofisiche della visione di basso livello per valutare la capacità delle metriche di qualità immagine e video di catturare fenomeni percettivi fondamentali, rivelando limiti e comportamenti specifici di 34 metriche esistenti.

Dounia Hammou, Yancheng Cai, Pavan Madhusudanarao, Christos G. Bampis, Rafał K. MantiukMon, 09 Ma💻 cs

Multivariate Fields of Experts for Convergent Image Reconstruction

Il paper introduce i "Multivariate Fields of Experts", un nuovo framework per l'apprendimento di priori delle immagini che, grazie a funzioni potenziali multivariate basate su involucri di Moreau, supera i modelli univariati e si avvicina alle prestazioni dei metodi deep learning offrendo al contempo maggiore velocità, efficienza dei parametri, interpretabilità e garanzie teoriche di convergenza per vari problemi inversi di ricostruzione.

Stanislas Ducotterd, Michael UnserMon, 09 Ma🤖 cs.LG

SAAIPAA: Optimizing aspect-angles-invariant physical adversarial attacks on SAR target recognition models

Il paper propone SAAIPAA, un framework per attacchi avversari fisici su modelli di riconoscimento automatico di bersagli SAR che, grazie a una modellazione fisica rigorosa, determina posizioni e orientamenti ottimali di riflettori per ingannare i sistemi di classificazione indipendentemente dagli angoli di aspetto della piattaforma, raggiungendo tassi di successo fino al 99,2% in scenari white-box.

Isar Lemeire, Yee Wei Law, Sang-Heon Lee, William Meakin, Tat-Jun ChinMon, 09 Ma⚡ eess

Learning Latent Transmission and Glare Maps for Lens Veiling Glare Removal

Il paper presenta VeilGen, un modello generativo non supervisionato che stima mappe latenti di trasmissione e bagliore per sintetizzare dati realistici, e DeVeiler, una rete di restauro che utilizza queste mappe per rimuovere efficacemente il bagliore velante dai sistemi ottici semplificati.

Xiaolong Qian, Qi Jiang, Lei Sun, Zongxi Yu, Kailun Yang, Peixuan Wu, Jiacheng Zhou, Yao Gao, Yaoguang Ma, Ming-Hsuan Yang, Kaiwei WangMon, 09 Ma🔬 physics.optics

In-batch Relational Features Enhance Precision in An Unsupervised Medical Anomaly Detection Task

Questo studio propone un metodo di rilevamento delle anomalie mediche non supervisionato che, integrando le somiglianze contestuali all'interno di un batch tramite ipergrafi e convoluzioni grafiche, riduce significativamente i falsi positivi distinguendo meglio le variazioni anatomiche normali dalle patologie.

P. Bilha Githinji, Xi Yuan, Ijaz Gul, Lian Zhang, Jinhao Xu, Zhenglin Chen, Peiwu Qin, Dongmei YuMon, 09 Ma🧬 q-bio

Clinical-Injection Transformer with Domain-Adapted MAE for Lupus Nephritis Prognosis Prediction

Questo studio propone il primo quadro computazionale multimodale per la prognosi della nefrite lupica pediatrica, che combina dati clinici e istopatologici tramite un Transformer a iniezione clinica e un MAE adattato al dominio, ottenendo un'accuratezza del 90,1% nella previsione della risposta al trattamento utilizzando solo biopsie colorate con PAS.

Yuewen Huang, Zhitao Ye, Guangnan Feng, Fudan Zheng, Xia Gao, Yutong LuMon, 09 Ma🤖 cs.LG

Edges Are All You Need: Robust Gait Recognition via Label-Free Structure

Il paper propone SKETCHGAIT, un nuovo framework per il riconoscimento dell'andatura che supera i limiti delle rappresentazioni basate su silhouette e parsing introducendo una modalità visiva "sketch" estratta in modo privo di etichette dai contorni strutturali delle immagini RGB, ottenendo risultati superiori su dataset pubblici.

Chao Zhang, Zhuang Zheng, Ruixin Li, Zhanyong MeiMon, 09 Ma💻 cs

Privacy-Preserving Collaborative Medical Image Segmentation Using Latent Transform Networks

Questo lavoro presenta il PPCMI-SF, un framework collaborativo che garantisce la privacy nella segmentazione di immagini mediche attraverso trasformazioni latenti crittografate, ottenendo risultati accurati e sicuri senza condividere dati grezzi tra istituzioni.

Saheed Ademola Bello, Muhammad Shahid Jabbar, Muhammad Sohail Ibrahim, Shujaat KhanMon, 09 Ma💻 cs

Gabor Primitives for Accelerated Cardiac Cine MRI Reconstruction

Il paper propone l'uso di primitive di Gabor, che modulano involucri gaussiani con esponenziali complessi per rappresentare efficacemente sia le strutture lisce che i confini netti, combinati con una decomposizione temporale a basso rango per ricostruire immagini di risonanza magnetica cardiaca cine accelerate, superando le prestazioni dei metodi esistenti come la compressione sensoriale e le rappresentazioni neurali implicite.

Wenqi Huang, Veronika Spieker, Nil Stolt-Ansó, Natascha Niessen, Maik Dannecker, Sevgi Gokce Kafali, Sila Kurugol, Julia A. Schnabel, Daniel RueckertMon, 09 Ma💻 cs

Longitudinal Lesion Inpainting in Brain MRI via 3D Region Aware Diffusion

Il paper presenta un nuovo framework longitudinale di inpainting per risonanze magnetiche cerebrali basato su modelli di diffusione 3D region-aware, che supera le tecniche esistenti garantendo maggiore fedeltà percettiva, stabilità temporale ed efficienza computazionale nell'analisi delle lesioni evolutive.

Zahra Karimaghaloo, Dumitru Fetco, Haz-Edine Assemlal, Hassan Rivaz, Douglas L. ArnoldMon, 09 Ma🤖 cs.AI

Interpretable Motion Artificat Detection in structural Brain MRI

Questo lavoro propone un framework leggero e interpretabile basato su estensioni tridimensionali dell'istogramma discriminativo del gradiente (DHoGM) per rilevare in modo efficiente e robusto gli artefatti da movimento nelle risonanze magnetiche cerebrali strutturali, ottenendo elevate prestazioni di generalizzazione su dati non visti senza richiedere costosi pre-processing.

Naveetha Nithianandam, Prabhjot Kaur, Anil Kumar SaoMon, 09 Ma💻 cs

Uni-LVC: A Unified Method for Intra- and Inter-Mode Learned Video Compression

Il paper presenta Uni-LVC, un metodo unificato per la compressione video appresa che integra la codifica intra e inter in un singolo modello, migliorando le prestazioni di compressione e adattandosi dinamicamente alla qualità dei riferimenti temporali grazie a un modulo di attenzione incrociata e una strategia di training multistadio.

Yichi Zhang, Ruoyu Yang, Fengqing ZhuMon, 09 Ma💻 cs

Architectural Unification for Polarimetric Imaging Across Multiple Degradations

Questo lavoro propone un framework architetturale unificato per l'imaging polarimetrico che, attraverso un elaborazione congiunta singola fase nei domini dell'immagine e di Stokes, supera le limitazioni dei metodi esistenti ottenendo prestazioni all'avanguardia nel recupero di parametri fisici coerenti da osservazioni degradate da rumore, sfocatura da movimento e artefatti di mosaico.

Chu Zhou, Yufei Han, Junda Liao, Linrui Dai, Wangze Xu, Art Subpa-Asa, Heng Guo, Boxin Shi, Imari SatoMon, 09 Ma💻 cs

Technical Report: Automated Optical Inspection of Surgical Instruments

Questo rapporto presenta un sistema di ispezione ottica automatizzata basato su architetture di deep learning (YOLOv8, ResNet-152 ed EfficientNet-b4) e un nuovo dataset di 4.414 immagini, sviluppato in collaborazione con leader dell'industria di Sialkot per rilevare difetti critici negli strumenti chirurgici pakistani e garantire la sicurezza dei pazienti.

Zunaira Shafqat, Atif Aftab Ahmed Jilani, Qurrat Ul AinMon, 09 Ma🤖 cs.AI

Enhancing Neural Video Compression of Static Scenes with Positive-Incentive Noise

Il paper propone un metodo di compressione video neurale per scene statiche che incorpora un "rumore a incentivo positivo" per distinguere le variazioni temporali transitorie dallo sfondo persistente, permettendo di ridurre significativamente il consumo di banda mantenendo la fedeltà a livello di pixel senza introdurre dettagli allucinati.

Cheng Yuan, Zhenyu Jia, Jiawei Shao, Xuelong LiMon, 09 Ma💻 cs

NOVA: Next-step Open-Vocabulary Autoregression for 3D Multi-Object Tracking in Autonomous Driving

Il paper introduce NOVA, un nuovo paradigma di autoregressione open-vocabulary che sfrutta i modelli linguistici su larga scala per trasformare il tracciamento 3D di oggetti multipli in un compito di completamento di sequenze spaziotemporali, ottenendo prestazioni superiori nel tracciamento di categorie sconosciute rispetto ai metodi tradizionali.

Kai Luo, Xu Wang, Rui Fan, Kailun YangMon, 09 Ma💻 cs

Can we Trust Unreliable Voxels? Exploring 3D Semantic Occupancy Prediction under Label Noise

Questo lavoro introduce il benchmark OccNL e il framework DPR-Occ per affrontare la previsione dell'occupazione semantica 3D in presenza di rumore di etichetta, dimostrando che le strategie esistenti falliscono in spazi voxel sparsi e proponendo un metodo innovativo basato sul ragionamento su etichette parziali che mantiene prestazioni elevate anche con un rumore del 90%.

Wenxin Li, Kunyu Peng, Di Wen, Junwei Zheng, Jiale Wei, Mengfei Duan, Yuheng Zhang, Rui Fan, Kailun YangMon, 09 Ma💻 cs

AI End-to-End Radiation Treatment Planning Under One Second

Il paper presenta AIRT, un framework di deep learning end-to-end che genera piani di radioterapia VMAT per il cancro alla prostata in meno di un secondo, dimostrando una qualità non inferiore ai piani standard prodotti da RapidPlan Eclipse.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin ComaniciuMon, 09 Ma🤖 cs.AI

EquivAnIA: A Spectral Method for Rotation-Equivariant Anisotropic Image Analysis

Il paper presenta EquivAnIA, un nuovo metodo spettrale basato su wavelet a torta e filtri a cresta per l'analisi anisotropa delle immagini, che garantisce una robusta equivarianza alle rotazioni numeriche e viene validato su dati sintetici e reali per compiti come la registrazione angolare.

Jérémy Scanvic, Nils LaurentFri, 13 Ma⚡ eess

← Precedente Successivo →