Unified Reward Model for Multimodal Understanding and Generation
Die Arbeit stellt UnifiedReward vor, das erste einheitliche Belohnungsmodell, das durch das gemeinsame Lernen zur Bewertung vielfältiger visueller Aufgaben Synergieeffekte nutzt und sowohl das Verständnis als auch die Generierung von Bildern und Videos durch menschliche Präferenzalignment verbessert.