A Hidden Semantic Bottleneck in Conditional Embeddings of Diffusion Transformers
Questo studio rivela che gli embedding condizionali nei Diffusion Transformers presentano un collo di bottiglia semantico caratterizzato da un'elevata ridondanza angolare e da una concentrazione del segnale informativo in poche dimensioni, permettendo di ridurre drasticamente lo spazio degli embedding senza compromettere la qualità della generazione.