TP-Blend: Textual-Prompt Attention Pairing for Precise Object-Style Blending in Diffusion Models
Le papier présente TP-Blend, un cadre léger et sans entraînement qui fusionne de manière précise un objet et un style distincts dans les modèles de diffusion en combinant une fusion d'attention croisée optimisée par transport optimal et une fusion d'attention auto-attentionnelle sensible aux détails via une normalisation instance.