Spread them Apart: Towards Robust Watermarking of Generated Content

In dit artikel wordt een methode voorgesteld om tijdens de inferentie robuuste watermerken in gegenereerde afbeeldingen in te bedden, waardoor de inhoud en de gebruiker kunnen worden geïdentificeerd zonder dat het model opnieuw getraind hoeft te worden.

Mikhail Pautov, Danil Ivanov, Andrey V. Galichin, Oleg Rogov, Ivan Oseledets

Gepubliceerd 2026-03-02
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Titel: "Spreid ze uit": Een onzichtbare handtekening voor AI-afbeeldingen

Stel je voor dat je een magische schilderijmachine hebt (een AI zoals Stable Diffusion). Je zegt: "Teken een zwart katje in een neoclassicistische stijl," en poef, daar staat het. Het ziet er zo echt uit dat je het nauwelijks van een echte foto kunt onderscheiden.

Maar hier zit het probleem: Iedereen kan deze machine gebruiken. Wat als iemand een mooi plaatje maakt, het op zijn naam zet en zegt: "Dit heb ik getekend, het is van mij!"? Of wat als iemand een nepnieuwsfoto maakt en zegt dat het echt is? We hebben een manier nodig om te weten wie de maker is en of een plaatje door de AI is gemaakt.

De auteurs van dit paper hebben een slimme oplossing bedacht, die ze "Spread them Apart" (Spreid ze uit) noemen. Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Het idee: Een onzichtbare vingerafdruk

Stel je voor dat je een brief schrijft. Normaal gesproken schrijf je gewoon de tekst. Maar deze nieuwe methode doet iets anders: terwijl de AI het plaatje "tekent", past ze heel subtiel de helderheid van twee specifieke pixels aan.

  • De sleutel: Elke gebruiker krijgt een geheime sleutel (een lijstje met getallen). Deze sleutel zegt de AI: "Vergelijk pixel A en pixel B. Als pixel A iets helderder is dan pixel B, dan betekent dat een '0'. Is pixel B helderder? Dan is het een '1'."
  • De code: Door duizenden van deze vergelijkingen te doen, ontstaat er een lang binair getal (een code van nullen en enen). Dit is de watermerk. Het is als een onzichtbare vingerafdruk die in de structuur van het plaatje zelf is gebakken, niet erop geplakt.

2. Hoe werkt het in de praktijk?

Normaal gesproken zou je een watermerk na het maken van de foto erop zetten (zoals een stempel). Maar dat is makkelijk weg te poetsen.

Deze methode doet het tijdens het maken:

  1. Je vraagt de AI om een plaatje.
  2. De AI begint met een wazig ruisje en maakt het steeds scherper.
  3. De AI kijkt constant: "Zit mijn geheime code (de vergelijking tussen pixel A en B) al in het plaatje?"
  4. Als het antwoord "nee" is, past de AI het plaatje heel klein beetje aan totdat de code wel klopt.
  5. Pas als de code perfect zit, geeft de AI het plaatje aan jou.

Het mooie hieraan: De AI hoeft niet opnieuw getraind te worden. Het is alsof je een bakker vraagt om een cake te bakken, maar je zegt: "Zorg dat de suikerkorrels in de bodem precies in een patroon liggen dat alleen jij kunt zien." De bakker past de cake aan tijdens het bakken, niet daarna.

3. Waarom is dit zo sterk? (De "Onkraakbare" Kluif)

De auteurs bewijzen wiskundig dat dit watermerk heel moeilijk te verwijderen is.

  • Helderheid en contrast: Als iemand het plaatje lichter of donkerder maakt, verandert dat de verhouding tussen pixel A en B niet. Het is alsof je een brief in een lichter of donkerder licht houdt; de letters staan er nog steeds op dezelfde manier.
  • Draaien en verschuiven: Als je het plaatje draait, kunnen de pixels verplaatsen. Daarom hebben de auteurs een slimme truc bedacht: ze steken de code niet alleen in de pixels, maar ook in de "muziek" van het plaatje (de frequenties). Zelfs als je het plaatje draait, blijft de "muziek" hetzelfde. Het is alsof je een liedje opneemt; als je de plaat draait, klinkt het liedje nog steeds hetzelfde, ook al bewegen de naald en de plaat.

4. Wat levert het op?

In hun experimenten hebben ze getoond dat hun methode beter werkt dan andere bekende methoden.

  • Robuustheid: Zelfs als iemand het plaatje bewerkt (helderheid, scherpte, JPEG-compressie) of zelfs probeert de code met een geavanceerde aanval te wissen, blijft de code grotendeels leesbaar.
  • Identificatie: Als je een plaatje ziet, kun je met de geheime sleutel van de gebruiker controleren: "Is dit plaatje gemaakt door gebruiker X?" Als de code klopt, weet je het zeker.

Samenvatting in één zin

Deze paper introduceert een manier om AI-afbeeldingen te "merken" terwijl ze worden gemaakt, door de verhouding tussen pixels zo te sturen dat ze een onzichtbare, onuitwisbare code vormen die zelfs na bewerkingen nog te lezen is.

Het is als het bakken van een koekje met een geheim recept in het deeg zelf, zodat je, zelfs als je het koekje in stukjes breekt of er suiker overheen strooit, nog steeds kunt zeggen: "Dit koekje is gemaakt door bakker Jan."

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →