RandMark: On Random Watermarking of Visual Foundation Models

Die Arbeit stellt RandMark vor, eine Methode zur Verifizierung des Eigentums an visuellen Fundamentmodellen, die durch zufälliges Einbetten digitaler Wasserzeichen in interne Repräsentationen eine zuverlässige Erkennung von Funktionskopien bei gleichzeitig geringer Fehlerrate ermöglicht.

Anna Chistyakova, Mikhail Pautov

Veröffentlicht 2026-03-12
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Das unsichtbare Siegel für KI-Künstler: Wie man KI-Modelle schützt

Stellen Sie sich vor, ein Künstler hat jahrelang an einem riesigen, genialen Gemälde gearbeitet. Es ist so gut, dass andere es kopieren und als ihr eigenes verkaufen wollen. Wie kann der ursprüngliche Künstler beweisen, dass das Bild ihm gehört, ohne das Bild zu zerstören oder zu verändern?

Genau dieses Problem lösen die Autoren Anna Chistyakova und Mikhail Pautov mit ihrer neuen Methode namens RandMark. Sie wollen „Visuelle Grundmodelle" (VFMs) schützen – das sind die super-intelligenten KI-Köpfe, die heute Bilder erkennen, beschreiben oder analysieren können.

1. Das Problem: Der teure Schatz

Diese KI-Modelle sind wie riesige Bibliotheken des Wissens. Sie zu bauen kostet Millionen und Jahre an Rechenzeit. Deshalb sind sie wertvolle Schätze. Die Besitzer wollen sie nicht einfach so verschenken, sondern lizenzieren. Aber leider gibt es „Diebe", die diese Modelle kopieren, leicht umbauen und dann illegal weiterverkaufen.

Bisherige Methoden, um die Diebe zu fangen, waren oft wie ein Fingerabdruck, den man nur bei einem bestimmten Foto abnehmen kann. Wenn der Dieb das Modell aber ein wenig verändert (z. B. für eine neue Aufgabe feinjustiert), ist der Fingerabdruck weg.

2. Die Lösung: Ein unsichtbarer Tintenfleck im Gehirn

Die Autoren haben eine clevere Idee: Statt das Modell selbst zu verändern, verstecken sie eine digitale Botschaft (ein Wasserzeichen) direkt im „Gedächtnis" des Modells.

Stellen Sie sich das KI-Modell wie einen Koch vor.

  • Der Koch (das Modell): Er kann Suppe kochen.
  • Das Wasserzeichen: Der Koch hat gelernt, dass er bei einem ganz bestimmten, zufälligen Rezept (einem speziellen Bild) immer eine winzige, unsichtbare Prise Salz in die Suppe gibt, die nur er kennt.

Wie funktioniert das?

  1. Einspeichern (Der Koch lernt): Der Besitzer nimmt eine Liste von zufälligen Bildern und sagt dem Koch: „Wenn du dieses Bild siehst, verstecke in deiner Antwort eine geheime Nachricht (z. B. 'Ich bin von Anna')."
  2. Der Trick: Der Koch lernt nicht, das Bild anders zu sehen, sondern er lernt, wie er innerhalb seiner Gedanken (den neuronalen Verbindungen) diese Nachricht versteckt. Es ist, als würde er eine geheime Signatur in seine Kochhandschuhe nähen, die man nur sieht, wenn man genau weiß, wonach man sucht.
  3. Der Zufall: Das Besondere an „RandMark" ist, dass sie das Bild vor dem Eingeben leicht „verzerren" (wie ein leichtes Wackeln der Kamera). Der Koch muss die Nachricht auch dann noch finden können, wenn das Bild nicht 100 % identisch ist. Das macht den Trick sehr robust.

3. Der Test: Wer ist der echte Koch?

Wenn jemand behauptet, er habe den Koch (das Modell) selbst entwickelt, kann der Besitzer den Test machen:

  • Er zeigt dem Koch das geheime Rezept.
  • Er fragt: „Was ist deine geheime Nachricht?"
  • Der echte Koch (oder eine Kopie): Da er die Nachricht in seinem „Gedächtnis" hat, wird er sie fast immer richtig rüberbringen.
  • Der Betrüger (ein unabhängiges Modell): Da er die Nachricht nie gelernt hat, wird er raten. Seine Antwort wird völlig zufällig sein und nicht mit der geheimen Nachricht übereinstimmen.

4. Warum ist das so stark? (Die Robustheit)

Das Geniale an dieser Methode ist, dass sie auch dann funktioniert, wenn der Dieb das Modell „umrüstet".

  • Feinabstimmung: Wenn der Dieb den Koch trainiert, jetzt auch Pizza zu machen (eine neue Aufgabe), bleibt die geheime Salz-Prise im Gehirn trotzdem erhalten.
  • Beschneiden: Selbst wenn der Dieb 40 % des Gehirns des Kochs entfernt (um es schneller zu machen), ist die Nachricht immer noch da.

Andere Methoden scheitern oft schon bei kleinen Änderungen. RandMark ist wie ein Tattoo auf der Seele des Modells – es bleibt, egal wie sehr man die Kleidung (die Aufgaben) wechselt.

5. Das Ergebnis

Die Forscher haben gezeigt, dass ihre Methode:

  • Sehr sicher ist: Sie erkennt fast immer, wenn jemand eine Kopie hat (wenig „falsche Alarme").
  • Sehr zuverlässig ist: Sie verwechselt keine harmlosen, unabhängigen Modelle mit Kopien.
  • Die Leistung nicht ruiniert: Das Modell kann weiterhin super Aufgaben lösen, während es gleichzeitig sein Eigentum schützt.

Zusammenfassend:
RandMark ist wie ein unsichtbarer, unverwüstlicher Stempel, den man in das Gehirn einer KI drückt. Egal, wie sehr die KI später trainiert wird oder verändert wird, dieser Stempel bleibt erhalten und verrät immer, wem das Gehirn wirklich gehört. Ein genialer Schutz für die wertvollsten digitalen Schätze unserer Zeit.