BeautyGRPO: Aesthetic Alignment for Face Retouching via Dynamic Path Guidance and Fine-Grained Preference Modeling
Das Paper stellt BeautyGRPO vor, ein Reinforcement-Learning-Framework, das mithilfe eines feinabgestimmten Präferenzmodells und einer dynamischen Pfadführung (DPG) Gesichtsretusche so optimiert, dass es subtile Makel entfernt und gleichzeitig die Gesichtsidentität bewahrt, um menschliche ästhetische Vorlieben besser zu erfüllen als bestehende Methoden.