Locality-aware Parallel Decoding for Efficient Autoregressive Image Generation
Il paper presenta la Locality-aware Parallel Decoding (LPD), un nuovo metodo che accelera la generazione di immagini autoregressive riducendo drasticamente i passaggi e la latenza attraverso un'architettura di modellazione parallela flessibile e un ordinamento della generazione consapevole della località, mantenendo al contempo la qualità su ImageNet.