Revisiting Global Token Mixing in Task-Dependent MRI Restoration: Insights from Minimal Gated CNN Baselines

Questo studio dimostra che l'utilità del mescolamento globale dei token nel ripristino delle immagini MRI è dipendente dal compito specifico, risultando meno vantaggiosa quando la fisica dell'acquisizione e i vincoli di consistenza dei dati impongono già accoppiamenti globali, mentre si rivela essenziale per compiti come la rimozione del rumore eteroschedastico spaziale.

Xiangjian Hou, Chao Qin, Chang Ni + 3 more2026-03-03⚡ eess

Deepfake Forensics Adapter: A Dual-Stream Network for Generalizable Deepfake Detection

Il documento presenta il Deepfake Forensics Adapter (DFA), un innovativo framework a doppio flusso che integra modelli fondazionali visione-linguaggio con analisi forense mirata per rilevare deepfake con capacità di generalizzazione superiore rispetto ai metodi esistenti, ottenendo risultati all'avanguardia su benchmark critici come DFDC.

Jianfeng Liao, Yichen Wei, Raymond Chan Ching Bon + 3 more2026-03-03💻 cs

From Verbatim to Gist: Distilling Pyramidal Multimodal Memory via Semantic Information Bottleneck for Long-Horizon Video Agents

Il paper propone MM-Mem, un'architettura di memoria multimodale piramidale ispirata alla teoria della traccia fuzzy che, attraverso un collo di bottiglia dell'informazione semantica e una strategia di recupero adattiva, risolve le limitazioni dei modelli attuali nell'analisi video a lungo termine bilanciando compressione e conservazione delle informazioni rilevanti.

Niu Lian, Yuting Wang, Hanshu Yao + 5 more2026-03-03💬 cs.CL

UltraStar: Semantic-Aware Star Graph Modeling for Echocardiography Navigation

Il paper presenta UltraStar, un metodo innovativo che supera i limiti delle tecniche esistenti per la navigazione automatica delle sonde ecocardiografiche modellando la storia delle scansioni come un grafo a stella semantico-orientato per un posizionamento globale robusto, riducendo così l'impatto dei percorsi rumorosi e migliorando le prestazioni su sequenze lunghe.

Teng Wang, Haojun Jiang, Chenxi Li + 6 more2026-03-03💻 cs

Rate-Distortion Signatures of Generalization and Information Trade-offs

Questo studio introduce un quadro teorico basato sulla teoria della distorsione del tasso per analizzare i compromessi tra accuratezza e robustezza nella visione artificiale e biologica, rivelando che, sebbene entrambi i sistemi seguano principi di compressione, gli esseri umani mostrano trade-off più flessibili rispetto alle reti neurali profonde, che operano in regimi più rigidi e fragili.

Leyla Roksan Caglar, Pedro A. M. Mediano, Baihan Lin2026-03-03🧬 q-bio

Downstream Task Inspired Underwater Image Enhancement: A Perception-Aware Study from Dataset Construction to Network Design

Il paper propone il framework DTI-UIE, una soluzione di miglioramento delle immagini subacquee ispirata ai compiti a valle che, attraverso una rete neurale a due rami e un dataset costruito automaticamente, ottimizza le prestazioni di riconoscimento automatico (come segmentazione e rilevamento oggetti) superando i limiti dei metodi tradizionali focalizzati sulla percezione umana.

Bosen Lin, Feng Gao, Yanwei Yu + 2 more2026-03-03⚡ eess