Accelerating Diffusion via Hybrid Data-Pipeline Parallelism Based on Conditional Guidance Scheduling
Il paper propone un framework di parallelismo ibrido che combina la partizione dei dati basata sulla guida condizionale con una schedulazione adattiva del pipeline per accelerare l'inferenza dei modelli di diffusione, riducendo significativamente la latenza su GPU multiple senza compromettere la qualità dell'immagine.