TokenTrace: Multi-Concept Attribution through Watermarked Token Recovery

Die Arbeit stellt TokenTrace vor, ein proaktives Wasserzeichen-Framework, das durch die gleichzeitige Störung von Text-Prompt-Embeddings und latentem Rauschen sowie eine abfragebasierte Abfrage-Mechanik eine robuste und unabhängige Zuordnung mehrerer Konzepte (wie Objekte und Kunststile) in generierten Bildern ermöglicht.

Li Zhang, Shruti Agarwal, John Collomosse, Pengtao Xie, Vishal Asnani

Veröffentlicht 2026-02-24
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

TokenTrace: Der unsichtbare Fingerabdruck für KI-Kunst

Stellen Sie sich vor, ein Künstler malt ein wunderschönes Bild. Doch dann nutzt eine künstliche Intelligenz (KI) diesen Stil, um tausende neue Bilder zu erstellen, ohne den ursprünglichen Künstler zu erwähnen oder zu bezahlen. Das ist das große Problem heute: KI kann Stile kopieren, aber wer hat sie eigentlich gemacht?

Bisherige Lösungen waren wie ein unsichtbarer Tintenfleck auf dem fertigen Bild. Wenn man das Bild dann zuschneidet, komprimiert oder leicht verändert, verschwindet dieser Fleck oft. Oder schlimmer noch: Wenn ein Bild zwei Dinge zeigt (z. B. einen Hund im Stil von Van Gogh), konnten die alten Systeme nicht sagen, welcher Teil dem Hund und welcher Teil dem Stil gehört. Sie waren wie ein einzelner, großer Stempel, der über alles hinweggedrückt wurde.

TokenTrace ist eine neue, clevere Erfindung, die dieses Problem löst. Hier ist die Erklärung, wie es funktioniert, mit ein paar einfachen Vergleichen:

1. Der Trick: Nicht auf das Bild, sondern auf die "Gedanken" schauen

Stellen Sie sich vor, die KI ist ein Koch, der ein Gericht kocht.

  • Die alten Methoden haben versucht, ein unsichtbares Markenzeichen direkt in den fertigen Teller (das Bild) zu malen. Wenn der Teller dann zerkratzt wurde, war das Zeichen weg.
  • TokenTrace macht etwas anderes: Es mischt das Markenzeichen schon in die Zutaten und das Rezept, bevor das Essen überhaupt gekocht wird.

In der Welt der KI bedeutet das:

  • Die KI liest einen Text (z. B. "ein Hund im Stil von Van Gogh").
  • TokenTrace verändert ganz subtil die Bedeutung der Wörter (den Text-Code) und das Rauschen (den Startpunkt der KI), aus dem das Bild entsteht.
  • Es ist, als würde man dem Koch sagen: "Wenn du 'Hund' sagst, denke dabei an ein geheimes Signal A. Wenn du 'Van Gogh' sagst, denke an ein geheimes Signal B."

2. Das Problem mit dem "Gemisch": Mehrere Konzepte trennen

Das eigentliche Geniale an TokenTrace ist die Fähigkeit, Dinge zu trennen, die sich vermischen.
Stellen Sie sich vor, Sie haben einen Cocktail, der aus Orangensaft und Cola besteht.

  • Frühere Systeme sagten nur: "Da ist ein Cocktail!" Sie konnten nicht sagen, wie viel Orangensaft und wie viel Cola drin ist.
  • TokenTrace ist wie ein super-geübter Geschmacksprüfer. Wenn Sie ihm den Cocktail geben und sagen: "Schmeck mal nach Orange!", findet er das Orangensignal. Wenn Sie sagen: "Schmeck mal nach Cola!", findet er das Colasignal.

Das funktioniert, weil jedes Konzept (der Hund, der Stil) sein eigenes, separates geheimes Signal hat, das in den "Gedanken" der KI gespeichert wurde, bevor das Bild entstand.

3. Wie man es wiederfindet: Die "Suchanfrage"

Um herauszufinden, wer das Bild gemacht hat, braucht man keine Magie, sondern eine Frage.

  • Sie nehmen das fertige Bild.
  • Sie geben der KI eine Frage mit: "Zeig mir das Signal für den Hund."
  • Das System (das "TokenTrace-Modul") schaut sich das Bild an, sucht nach dem Signal für "Hund" und findet es – selbst wenn im Bild auch noch ein "Van Gogh-Stil" versteckt ist.
  • Dann fragt man: "Zeig mir das Signal für den Stil." Und auch das wird gefunden.

Warum ist das so wichtig?

  • Unzerstörbar: Weil das Signal in den "Gedanken" der KI (dem Text und dem Start-Rauschen) und nicht nur auf der Oberfläche des Bildes steckt, überlebt es auch, wenn das Bild bearbeitet, zugeschnitten oder komprimiert wird. Es ist wie ein DNA-Strang, der in jedem Zelle des Bildes enthalten ist.
  • Klarheit: Es kann endlich sagen: "Dieses Bild gehört dem Künstler X für den Stil und dem Künstler Y für das Motiv."
  • Unsichtbar: Für das menschliche Auge sieht das Bild genauso schön aus wie das Original. Die Veränderung ist so winzig, dass sie nicht zu sehen ist.

Zusammenfassung in einem Satz

TokenTrace ist wie ein unsichtbarer, unzerstörbarer Barcode, den man direkt in die "Rezeptur" einer KI schreibt, sodass man später mit einer einfachen Frage genau herausfinden kann, welche Ideen und Stile in einem Bild stecken – selbst wenn sie sich alle vermischen.

Damit schützen sie die Rechte von Künstlern und stellen sicher, dass KI nicht einfach stiehlt, sondern die Quellen ehrlich benennt.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →