eess.IV articoli | Gist.Science

Image Compression Using Novel View Synthesis Priors

Questo lavoro propone una tecnica di compressione delle immagini basata sulla sintesi di nuove viste per abilitare il feedback visivo in tempo reale nel controllo remoto di veicoli sottomarini, superando i limiti di larghezza di banda delle comunicazioni acustiche grazie all'uso di modelli di apprendimento automatico e ottimizzazione tramite discesa del gradiente.

Luyuan Peng, Mandar Chitre, Hari Vishnu, Yuen Min Too, Bharath Kalyan, Rajat Mishra, Soo Pieng TanWed, 11 Ma⚡ eess

Entropy-and-Channel-Aware Adaptive-Rate Semantic Communication with MLLM-Aided Feature Compensation

Il documento propone un nuovo framework di comunicazione semantica adattiva che, sfruttando l'entropia e lo stato del canale per regolare dinamicamente il tasso di trasmissione e integrando un modello linguistico multimodale (MLLM) per compensare le informazioni perse, ottimizza l'efficienza delle risorse e le prestazioni del compito su canali MIMO Rayleigh.

Weixuan Chen, Qianqian Yang, Yuhao Chen, Chongwen Huang, Qian Wang, Zehui Xiong, Zhaoyang ZhangWed, 11 Ma⚡ eess

LiM-YOLO: Less is More with Pyramid Level Shift and Normalized Auxiliary Branch for Ship Detection in Optical Remote Sensing Imagery

Il paper presenta LiM-YOLO, un rilevatore di navi ottimizzato per immagini satellitari che migliora accuratezza ed efficienza attraverso uno spostamento dei livelli della piramide delle caratteristiche da P3-P5 a P2-P4 e l'uso di normalizzazione a gruppi, risolvendo così le sfide poste dalla grande disparità di scala e dai rapporti d'aspetto elevati dei bersagli marittimi.

Seon-Hoon Kim, Hyeji Sim, Youeyun Jung, Ok-Chul Jung, Yerin KimWed, 11 Ma⚡ eess

Rydberg Vision via frugal Quantum Image Fingerprinting

Il paper presenta un framework nativo quantistico per il riconoscimento di immagini su computer analogici a atomi neutri, che trasforma i dati visivi in nuvole di punti sparse per codificarle fisicamente in un array di tweezers programmabili, sfruttando le interazioni di van der Waals e gli osservabili quantistici come il fattore di struttura statico per generare impronte digitali uniche che abilitano il matching e l'apprendimento automatico con un numero ridotto di atomi.

Vikrant Sharma, Neel Kanth KunduWed, 11 Ma⚛️ quant-ph

Exploiting Completeness Perception with Diffusion Transformer for Unified 3D MRI Synthesis

Il paper presenta CoPeDiT, un modello di diffusione latente basato su transformer che, grazie a una percezione autonoma dello stato di completezza dei dati, risolve in modo unificato e robusto i problemi di sintesi 3D delle risonanze magnetiche cerebrali e cardiache senza dipendere da guide esterne.

Junkai Liu, Nay Aung, Theodoros N. Arvanitis, Joao A. C. Lima, Steffen E. Petersen, Le ZhangWed, 11 Ma⚡ eess

Robust Wildfire Forecasting under Partial Observability: From Reconstruction to Prediction

Questo lavoro propone un framework probabilistico a due stadi che combina la ricostruzione di mappe di incendio corrotte tramite modelli di apprendimento profondo con la previsione della propagazione, dimostrando come tale approccio colmi il divario tra dati di addestramento e osservazioni parziali, ripristinando l'accuratezza predittiva anche in condizioni di grave perdita di informazioni.

Chen Yang, Mehdi Zafari, Ziheng Duan, A. Lee SwindlehurstWed, 11 Ma⚡ eess

M2Diff: Multi-Modality Multi-Task Enhanced Diffusion Model for MRI-Guided Low-Dose PET Enhancement

Il paper presenta M2Diff, un modello di diffusione multi-modale e multi-task che integra separatamente le scansioni MRI e PET a bassa dose per ricostruire immagini PET a dose standard con maggiore fedeltà, superando i limiti dei modelli esistenti e dimostrando efficacia sia su dati sani che su pazienti con malattia di Alzheimer.

Ghulam Nabi Ahmad Hassan Yar, Himashi Peiris, Victoria Mar, Cameron Dennis Pain, Zhaolin ChenWed, 11 Ma⚡ eess

DFPF-Net: Dynamically Focused Progressive Fusion Network for Remote Sensing Change Detection

Il paper propone la DFPF-Net, una rete di fusione progressiva dinamicamente focalizzata che combina un transformer a piramide con un modulo di attenzione e rilevamento dei bordi per migliorare l'accuratezza del rilevamento dei cambiamenti nelle immagini satellitari riducendo il rumore globale e locale.

Chengming Wang, Peng Duan, Jinjiang LiWed, 11 Ma⚡ eess

MetaSpectra+: A Compact Broadband Metasurface Camera for Snapshot Hyperspectral+ Imaging

Il paper presenta MetaSpectra+, una fotocamera compatta a metasuperficie in grado di acquisire in un singolo istante dati iperspettrali ad alta fedeltà su tutto lo spettro visibile combinati con immagini HDR o di polarizzazione, superando i limiti di banda e le dimensioni dei dispositivi precedenti.

Yuxuan Liu, Wei Xu, Qi GuoWed, 11 Ma⚡ eess

POLISH'ing the Sky: Wide-Field and High-Dynamic Range Interferometric Image Reconstruction with Application to Strong Lens Discovery

Questo lavoro estende il framework POLISH per la ricostruzione di immagini interferometriche radio, introducendo strategie di addestramento a patch e trasformazioni di intensità non lineari che permettono di gestire campi visivi ampi e alti rapporti dinamici, migliorando significativamente la scoperta di lenti gravitazionali forti nei dati simulati del DSA.

Zihui Wu, Liam Connor, Samuel McCarty, Katherine L. BoumanWed, 11 Ma🔭 astro-ph

Association of Radiologic PPFE Change with Mortality in Lung Cancer Screening Cohorts

Questo studio dimostra che la progressione radiologica della fibroelastosi pleuroparenchimale (PPFE) nei programmi di screening per il cancro del polmone è associata indipendentemente a un aumento della mortalità e a esiti clinici avversi, suggerendo che la sua valutazione quantitativa possa fungere da biomarcatore utile per identificare individui ad alto rischio respiratorio.

Shahab Aslani, Mehran Azimbagirad, Daryl Cheng, Daisuke Yamada, Ryoko Egashira, Adam Szmul, Justine Chan-Fook, Robert Chapman, Alfred Chung Pui So, Shanshan Wang, John McCabe, Tianqi Yang, Jose M Brenes, Eyjolfur Gudmundsson, The SUMMIT Consortium, Susan M. Astley, Daniel C. Alexander, Sam M. Janes, Joseph JacobWed, 11 Ma🧬 q-bio

When to Lock Attention: Training-Free KV Control in Video Diffusion

Il paper presenta KV-Lock, un metodo senza addestramento per i modelli di diffusione video basati su DiT che migliora la qualità del primo piano mantenendo la coerenza dello sfondo, regolando dinamicamente il blocco delle chiavi-valori e la scala della guida condizionale in base al rischio di allucinazione.

Tianyi Zeng, Jincheng Gao, Tianyi Wang, Zijie Meng, Miao Zhang, Jun Yin, Haoyuan Sun, Junfeng Jiao, Christian Claudel, Junbo Tan, Xueqian WangWed, 11 Ma🤖 cs.AI

$M^2$ -Occ: Resilient 3D Semantic Occupancy Prediction for Autonomous Driving with Incomplete Camera Inputs

Il paper presenta $M^2$ -Occ, un framework innovativo per la previsione dell'occupazione semantica 3D che garantisce resilienza e coerenza strutturale in scenari di guida autonoma con input multivista incompleti, grazie a un modulo di ricostruzione mascherata e a una memoria di caratteristiche che recuperano informazioni mancanti senza compromettere le prestazioni in condizioni ottimali.

Kaixin Lin, Kunyu Peng, Di Wen, Yufan Chen, Ruiping Liu, Kailun YangWed, 11 Ma⚡ eess

PanoAffordanceNet: Towards Holistic Affordance Grounding in 360{\deg} Indoor Environments

Il paper introduce PanoAffordanceNet, un nuovo framework end-to-end e il dataset 360-AGD per il grounding olistico delle affordance in ambienti interni a 360 gradi, superando le sfide delle distorsioni geometriche e della dispersione sematica attraverso modulatori spettrali adattivi e testine di densificazione sferica.

Guoliang Zhu, Wanjun Jia, Caoyang Shao, Yuheng Zhang, Zhiyong Li, Kailun YangWed, 11 Ma⚡ eess

CycleULM: A unified label-free deep learning framework for ultrasound localisation microscopy

Il paper presenta CycleULM, il primo framework di deep learning unificato e privo di etichette per la microscopia di localizzazione ultrasonora, che supera le limitazioni dei dati reali e del divario simulazione-realtà traducendo i dati CEUS in un dominio semplificato, migliorando significativamente contrasto, risoluzione e precisione di localizzazione dei microbolle con elaborazione in tempo reale.

Su Yan, Clara Rodrigo Gonzalez, Vincent C. H. Leung, Herman Verinaz-Jadan, Jiakang Chen, Matthieu Toulemonde, Kai Riemer, Jipeng Yan, Clotilde Vié, Qingyuan Tan, Peter D. Weinberg, Pier Luigi Dragotti, Kevin G. Murphy, Meng-Xing TangWed, 11 Ma⚡ eess

Improving Visual Object Tracking through Visual Prompting

Il paper presenta PiVOT, un nuovo meccanismo di prompting visivo che sfrutta il modello fondazionale CLIP per generare e raffinare dinamicamente prompt online, migliorando le prestazioni del tracciamento generico di oggetti sopprimendo efficacemente gli oggetti distraenti.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu LinTue, 10 Ma💻 cs

MAP-based Problem-Agnostic diffusion model for Inverse Problems

Questo articolo propone un modello di diffusione agnostico rispetto al problema, basato sulla stima del termine guidato tramite MAP, che sfrutta score network preaddestrati e un prior gaussiano per risolvere problemi inversi nell'elaborazione delle immagini con una migliore preservazione dei contenuti rispetto agli stati dell'arte.

Pingping Tao, Haixia Liu, Jing SuTue, 10 Ma💻 cs

Subclass Classification of Gliomas Using MRI Fusion Technique

Questo studio presenta un algoritmo che fonde immagini MRI multimodali pre-elaborate e segmentate tramite architetture UNET in 2D e 3D, per poi classificarle con un modello ResNet50, ottenendo un'accuratezza del 99,25% nella sottoclassificazione dei gliomi.

Kiranmayee Janardhan, Christy Bobby ThomasTue, 10 Ma💻 cs

Deep Learning-Based Approach for Automatic 2D and 3D MRI Segmentation of Gliomas

Questo studio propone un approccio di deep learning basato su architetture UNET, Inception e ResNet per la segmentazione automatica 2D e 3D dei gliomi, ottenendo risultati superiori (con un'accuratezza fino al 99,77% e un punteggio Dice di 0,9888) che bilanciano efficienza computazionale e precisione spaziale per supportare la diagnosi clinica.

Kiranmayee Janardhan, Christy Bobby TTue, 10 Ma💻 cs

Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes

Il paper propone un modello di apprendimento profondo geometrico basato su transformer che, integrando punti di riferimento anatomici in mesh tetraedriche derivanti da risonanza magnetica strutturale, migliora la diagnosi dell'Alzheimer e la previsione della positività all'amiloide cerebrale, riducendo la necessità di scansioni PET costose e invasive.

Yanxi Chen, Mohammad Farazi, Zhangsihao Yang, Yonghui Fan, Nicholas Ashton, Eric M Reiman, Yi Su, Yalin WangTue, 10 Ma💻 cs

eess.IV