VSF: Simple, Efficient, and Effective Negative Guidance in Few-Step Image Generation Models By Value Sign Flip

Deze paper introduceert Value Sign Flip (VSF), een efficiënte methode die door het omkeren van de teken van attentiewaarden negatieve prompts effectief onderdrukt in weinig-staps beeldgeneratiemodellen, wat resulteert in een betere naleving van prompts en een hogere beeldkwaliteit dan bestaande technieken.

Wenqi Guo, Shan Du

Gepubliceerd 2026-02-20
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

De VSF-methode: Hoe je een AI-kunstenaar vertelt wat je niet wilt, zonder de hele tekening te verpesten

Stel je voor dat je een zeer getalenteerde, maar soms wat koppige kunstenaar hebt. Je vraagt hem: "Teken een fiets." Hij doet dat graag. Maar als je zegt: "Teken een fiets, maar geen wielen," begint hij te twijfelen. In plaats van een fiets zonder wielen te tekenen, tekent hij vaak een fiets met wielen, of soms zelfs een auto, omdat hij denkt: "Oh, wielen horen bij een fiets, dus die moet ik erbij doen."

Dit is precies het probleem dat kunstmatige intelligentie (AI) heeft bij het maken van afbeeldingen. Als je zegt wat je niet wilt (een "negatieve prompt"), luistert de AI vaak niet goed, of maakt het de afbeelding juist vreemd en overbelicht.

De auteurs van dit paper hebben een nieuwe, slimme oplossing bedacht die VSF (Value Sign Flip) heet. Laten we uitleggen hoe dit werkt met een paar simpele analogieën.

1. Het oude probleem: De "Dubbele Werkkracht"

Vroeger probeerden AI's dit op te lossen door twee keer te werken:

  1. Eerst tekenen ze wat je wilt (een fiets).
  2. Dan tekenen ze wat je niet wilt (wielen), en trekken ze die tekening eruit.

Dit is als een kok die eerst een perfecte taart bakt, en dan een tweede taart bakt met alleen de ingrediënten die je niet wilt, en die twee taarten tegen elkaar aan duwt om te zien wat er overblijft. Het werkt soms, maar het kost dubbel zoveel tijd en bij snelle AI's (die in 1 of 2 stappen werken) gaat het vaak mis: de taart wordt een rommelige soep van taart en anti-taart.

2. De nieuwe oplossing: VSF (De "Geluidsdempende Koptelefoon")

De VSF-methode is veel slimmer en sneller. Het werkt als een geluidsdempende koptelefoon.

  • Hoe koptelefoons werken: Als er een geluid (ruis) is, maakt de koptelefoon een geluid dat precies het tegenovergestelde is (omgekeerde golf). Als je die twee geluiden samenvoegt, doven ze elkaar uit. Stilte is het resultaat.
  • Hoe VSF werkt: De AI kijkt naar de woorden die je niet wilt (bijvoorbeeld "wielen"). In plaats van een tweede tekening te maken, pakt de AI de "kracht" van die woorden in de computer en draait het teken om (van plus naar min).
    • Stel je voor dat de woorden "wielen" een rood lichtje zijn dat brandt op de fiets.
    • VSF draait dat lichtje om, zodat het een blauw lichtje wordt dat de roodheid "opheft".
    • Waar de AI normaal zou denken "Ah, wielen!", denkt hij nu "Ah, wielen... maar die zijn hier juist uitgesloten!"

Dit gebeurt dynamisch. Dat betekent dat de AI op elk moment tijdens het tekenen kijkt: "Oh, op dit stukje van de afbeelding lijkt het wel op een wiel. Dan moet ik die 'anti-wiel'-kracht daar extra hard toepassen." Op andere plekken, waar er geen wiel te zien is, doet hij niets.

3. Waarom is dit zo cool?

  • Snelheid: Omdat de AI niet twee keer hoeft te werken, maar gewoon één keer "omdraait", is het super snel. Je kunt binnen 3 seconden een afbeelding krijgen.
  • Precisie: Het werkt zelfs bij de nieuwste, snelste AI's die normaal gesproken niet goed luisteren naar wat je niet wilt.
  • Creativiteit: Je kunt er zelfs kunst mee maken die "moeilijk" is. Bijvoorbeeld: "Teken een auto, maar maak het zo abstract dat het bijna niet meer lijkt op een auto." De AI kan dit nu doen door de "auto-kracht" gedeeltelijk uit te wissen, zonder de hele afbeelding te verpesten.

4. Een concreet voorbeeld

Stel je vraagt: "Teken een huis zonder dak."

  • Oude methode: De AI tekent een huis, probeert het dak weg te halen, maar het dak blijft soms als een zwevende schaduw hangen, of het huis wordt een vreemde vorm.
  • Met VSF: De AI ziet het woord "dak", draait de kracht om, en zorgt dat op de plek waar het dak zou moeten zijn, gewoon lucht of wolken verschijnen. Het resultaat is een huis dat eruitziet alsof het dak er nooit was.

Conclusie

De auteurs van dit paper hebben een manier gevonden om AI's beter te laten luisteren naar wat je niet wilt, zonder dat het lang duurt of de kwaliteit van de afbeelding verlaagt. Het is alsof je de AI een slimme bril geeft die precies ziet wat je wilt weghalen, en dat dan netjes "wegveegt" terwijl de rest van de afbeelding perfect blijft.

Dit maakt het makkelijker om AI te gebruiken voor dingen die echt nodig zijn, zoals het verwijderen van ongewenste objecten uit foto's of het creëren van unieke, abstracte kunst zonder dat de computer in de war raakt.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →