TIDE: Text-Informed Dynamic Extrapolation with Step-Aware Temperature Control for Diffusion Transformers
O artigo apresenta o TIDE, um método livre de treinamento para a extrapolação de resolução em Transformers de Difusão (DiT) que, ao corrigir o desequilíbrio entre tokens de texto e imagem e controlar dinamicamente a temperatura, permite a geração de imagens em resoluções e proporções arbitrárias sem degradar detalhes semânticos ou introduzir artefatos.