GMAIL: Generative Modality Alignment for generated Image Learning
Das Paper stellt GMAIL vor, ein neuartiges Framework, das generierte Bilder als eigenständige Modalität behandelt und durch Ausrichtung im latenten Raum deren effektive Nutzung zur Verbesserung verschiedener Vision-Language-Aufgaben ermöglicht.