EDITOR: Effective and Interpretable Prompt Inversion for Text-to-Image Diffusion Models
Ce papier propose EDITOR, une méthode efficace et interprétable d'inversion de prompts pour les modèles de diffusion texte-à-image qui, en combinant l'initialisation par un modèle de légendage, l'affinement dans l'espace latent et la conversion en texte, surpasse les approches existantes en termes de similarité d'image, d'alignement textuel et de généralisabilité pour diverses applications créatives.