Decomposing Private Image Generation via Coarse-to-Fine Wavelet Modeling

Questo lavoro propone un framework di generazione di immagini con privacy differenziale che, sfruttando la trasformata wavelet, addestra un modello autoregressivo solo sui coefficienti a bassa frequenza (strutture globali) per preservare la privacy, mentre utilizza un modello di super-risoluzione preaddestrato pubblicamente per ricostruire i dettagli ad alta frequenza, ottenendo così un miglior compromesso tra qualità dell'immagine e protezione dei dati.

Jasmine Bayrooti, Weiwei Kong, Natalia Ponomareva + 3 more2026-02-27💻 cs

LineGraph2Road: Structural Graph Reasoning on Line Graphs for Road Network Extraction

Il paper presenta LineGraph2Road, un framework innovativo che migliora l'estrazione automatica delle strade da immagini satellitari trasformando il problema di previsione della connettività in una classificazione binaria su un grafo euclideo globale e applicando un Graph Transformer sul suo grafo delle linee per catturare dipendenze a lungo raggio e topologie complesse, ottenendo risultati all'avanguardia su metriche chiave come TOPO-F1 e APLS.

Zhengyang Wei, Renzhi Jing, Yiyi He + 1 more2026-02-27💻 cs

PGVMS: A Prompt-Guided Unified Framework for Virtual Multiplex IHC Staining with Pathological Semantic Learning

Il paper presenta PGVMS, un framework unificato guidato da prompt che risolve le sfide della colorazione IHC multiplex virtuale attraverso l'uso di un modello linguistico-visivo patologico, una strategia di apprendimento consapevole delle proteine e un apprendimento basato su prototipi coerenti per generare rappresentazioni IHC multiple da immagini H&E utilizzando solo dati di addestramento uniplex.

Fuqiang Chen, Ranran Zhang, Wanming Hu + 6 more2026-02-27💻 cs

ManifoldGD: Training-Free Hierarchical Manifold Guidance for Diffusion-Based Dataset Distillation

Il paper presenta ManifoldGD, un framework di distillazione dei dati basato su modelli di diffusione che, senza necessità di riaddestramento, migliora la qualità e la diversità dei dataset sintetici guidando il processo di generazione attraverso una proiezione geometrica su un manifold latente gerarchico derivato da clustering.

Ayush Roy, Wei-Yang Alex Lee, Rudrasis Chakraborty + 1 more2026-02-27🤖 cs.LG

Scale Can't Overcome Pragmatics: The Impact of Reporting Bias on Vision-Language Reasoning

Lo studio dimostra che il pregiudizio di reporting nei dati di addestramento limita le capacità di ragionamento dei modelli visione-linguaggio, rendendo inefficace la semplice scalabilità e sottolineando la necessità di una curatela intenzionale dei dati per colmare le lacune nelle competenze spaziali, temporali, di negazione e di conteggio.

Amita Kamath, Jack Hessel, Khyathi Chandu + 3 more2026-02-27💬 cs.CL

Improving Denoising Diffusion Models via Simultaneous Estimation of Image and Noise

Questo paper propone un approccio innovativo per migliorare i modelli di diffusione denoising, basato sulla riparametrizzazione del processo tramite un angolo su un arco circolare per abilitare solutori ODE di ordine superiore e sulla stima simultanea dell'immagine e del rumore, ottenendo così una generazione più rapida e immagini di qualità superiore.

Zhenkai Zhang, Krista A. Ehinger, Tom Drummond2026-02-26🤖 cs.AI