Rethinking Preference Alignment for Diffusion Models with Classifier-Free Guidance

Deze paper introduceert een methode voor het verbeteren van de uitlijning van diffusion-modellen met menselijke voorkeuren door classifier-free guidance te gebruiken als testtijd-sturing via een contrastief vector, waardoor een betere generalisatie wordt bereikt zonder het basismodel opnieuw te hoeven trainen.

Zhou Jiang, Yandong Wen, Zhen Liu

Gepubliceerd 2026-02-24
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een zeer getalenteerde kunstenaar hebt die miljoenen schilderijen heeft gezien. Deze kunstenaar (het Diffusion Model) kan prachtige afbeeldingen maken, maar omdat hij zo veel heeft gezien, weet hij niet precies wat jij mooi vindt. Soms maakt hij iets dat technisch perfect is, maar saai, of iets dat niet helemaal klopt met wat je hebt gevraagd.

Om deze kunstenaar te leren wat mensen echt leuk vinden, hebben onderzoekers een nieuwe methode bedacht, beschreven in dit paper. Ze noemen het PGD en cPGD.

Hier is hoe het werkt, vertaald naar alledaagse termen:

1. Het Probleem: De "Lekke Band" van de Kunstenaar

Vroeger probeerden ze de kunstenaar te trainen door hem duizenden voorbeelden te laten zien van "mooi" versus "niet mooi". Dit heet DPO.

  • De analogie: Stel je voor dat je een student laat studeren voor een examen door hem alleen de juiste antwoorden te geven, maar ook de verkeerde antwoorden. Als je te lang doorgaat, raakt de student in de war. Hij begint de verkeerde antwoorden uit zijn hoofd te leren of hij wordt zo bang om fouten te maken dat hij helemaal niets meer durft te doen. Hij "overleert" (overfitting) en raakt zijn creativiteit kwijt.

2. De Oplossing: De "Gids" in plaats van de "Leraar"

De auteurs zeggen: "Wacht even, we hoeven de kunstenaar niet helemaal opnieuw te leren. We kunnen gewoon een gids bij hem zetten tijdens het maken van het schilderij."

Dit noemen ze Classifier-Free Guidance (CFG).

  • De analogie: Stel je voor dat de kunstenaar (het basismodel) een schilderij begint te maken. Normaal gesproken doet hij dit alleen.
    • Bij de oude methode (DPO) probeerden we de kunstenaar zelf te herschrijven.
    • Bij de nieuwe methode (PGD) laten we de kunstenaar werken, maar houden we een gids naast hem. Deze gids heeft een lijstje met wat mensen leuk vinden.
    • Terwijl de kunstenaar werkt, zegt de gids: "Hé, die kleur is niet helemaal wat we willen, maak het iets anders."
    • De kunstenaar luistert naar de gids, maar blijft zelf de meester. Hierdoor blijft hij creatief, maar wordt het resultaat wel beter afgestemd op wat mensen willen.

3. De Slimme Variant: Twee Gidsen (cPGD)

De auteurs vonden een nog slimmere manier: cPGD (contrastive PGD).

  • De analogie: In plaats van één gids die alleen zegt wat wel mooi is, hebben ze nu twee gidsen:
    1. Gids A: Zegt alleen wat mooi is (bijvoorbeeld: "Een hond met bloemen").
    2. Gids B: Zegt alleen wat niet mooi is (bijvoorbeeld: "Een hond die eruitziet als een brood").
  • Tijdens het maken van het schilderij nemen ze het advies van Gids A en trekken ze daar het advies van Gids B vanaf.
    • Resultaat: "Neem de mooie hond, maar trek de lelijke hond er af."
    • Dit geeft een heel scherp, duidelijk signaal. Het is alsof je een foto hebt van wat je wilt, en je trekt er een foto van wat je niet wilt af. Wat overblijft, is precies wat je zoekt.

4. Waarom is dit beter?

  • Geen overtraining: Omdat de kunstenaar zelf niet zwaar wordt getraind, blijft hij flexibel en maakt hij geen rare, starre fouten.
  • Plug-and-Play: Je kunt deze "gidsen" maken en ze op elke kunstenaar (elk model) plakken. Het is alsof je een nieuwe bril opzet; je hoeft je ogen niet te opereren.
  • Beter resultaat: In tests bleek dat deze methode veel vaker een mooi schilderij maakt dan de oude methoden, en dat de schilderijen er natuurlijker uitzien.

Samenvatting in één zin

In plaats van de kunstenaar zelf te dwingen om alles perfect te doen (wat vaak mislukt), zetten we slimme gidsen naast hem die tijdens het proces zeggen: "Dit is goed, dat is niet goed," zodat het eindresultaat precies is wat jij wilt, zonder dat de kunstenaar zijn creativiteit verliest.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →