Accelerating Text-to-Video Generation with Calibrated Sparse Attention
Il paper presenta CalibAtt, un metodo senza addestramento che accelera la generazione video da testo mediante un'attenzione sparsa calibrata che identifica e salta le connessioni tra token irrilevanti, ottenendo un significativo aumento della velocità senza compromettere la qualità.