SemanticDialect: Semantic-Aware Mixed-Format Quantization for Video Diffusion Transformers
Il paper presenta SemanticDialect, un metodo di quantizzazione mista semantica che ottimizza la generazione video su dispositivi edge riducendo i costi computazionali e preservando la coerenza temporale e semantica attraverso la selezione dinamica di formati per blocco, la decomposizione delle attivazioni e l'assegnazione di dialetti basata sulla correlazione semantica.