Vision-Encoder Behavioral Fingerprints of Image-to-Image Generative Models: A Training-Paradigm-Driven Taxonomy of Six Commercial APIs

Dieses Paper schlägt eine durch das Trainingsparadigma getriebene Taxonomie von sechs kommerziellen Image-to-Image-generativen Modellen vor und zeigt auf, dass diese sich basierend auf ihrer Reaktion auf inhaltsadaptive Sub-JND-adversarielle Perturbationen, gemessen via gefrorener DINOv2-Token-Distanzen, in zwei distinkte Verhaltenscluster unterteilen lassen – edit-trained versus sampling-time adapted.

Ursprüngliche Autoren: Hunter Hill

Veröffentlicht 2026-06-16
📖 5 Min. Lesezeit🧠 Tiefgang

Ursprüngliche Autoren: Hunter Hill

Originalarbeit lizenziert unter CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dies ist eine KI-generierte Erklärung des untenstehenden Papers. Sie wurde nicht von den Autoren verfasst oder gebilligt. Für technische Genauigkeit konsultieren Sie das Originalpaper. Vollständigen Haftungsausschluss lesen

Stellen Sie sich vor, Sie besitzen eine ganz besondere, unsichtbare Tinte, mit der Sie ein Foto bemalen können. Diese Tinte ist so schwach, dass das menschliche Auge sie nicht sehen kann, aber sie hinterlässt einen einzigartigen „Fingerabdruck“ in der digitalen DNA des Bildes.

Dieses Papier handelt davon, was passiert, wenn man Fotos, die mit dieser unsichtbaren Tinte bemalt wurden, durch sechs verschiedene populäre KI-Tools laufen lässt, die dazu entwickelt wurden, Bilder zu bearbeiten oder neu zu zeichnen (wie zum Beispiel das Verwandeln einer Skizze in ein Foto oder das Ändern des Stils eines Bildes).

Hier ist die einfache Aufschlüsselung dessen, was die Forscher herausgefunden haben:

1. Die zwei „Persönlichkeitsgruppen“

Die Forscher testeten sechs verschiedene kommerzielle KI-Systeme. Sie erwarteten, dass die Ergebnisse davon abhängen würden, wie die KI aufgebaut ist (ihre Architektur). Stattdessen stellten sie fest, dass sich die KIs basierend auf der Art und Weise, wie sie trainiert wurden, in zwei deutliche „Persönlichkeitsgruppen“ sortierten:

  • Die „Sorgfältigen Editoren“ (Das enge Band): Diese KIs (wie Flux Kontext, Qwen Edit und Gemini) wurden speziell darauf trainiert, Anweisungen zur Bearbeitung eines bestehenden Fotos zu folgen. Wenn man ihnen ein Foto gibt, versuchen sie, es so nah wie möglich am Original zu halten.
    • Die Analogie: Denken Sie an diese wie an einen Fotografen, der Photoshop benutzt. Er passt die Beleuchtung oder die Farben an, behält aber die Struktur und die Details des Originalfotos bei. Er bewahrt Ihren unsichtbaren Tinten-Fingerabdruck fast perfekt.
  • Die „Starken Regeneratoren“ (Das Drift-Band): Diese KIs (wie SDXL, SD3 und gpt-image-1) wurden ursprünglich dafür trainiert, Bilder von Grund auf neu zu erschaffen (Text-zu-Bild) und wurden erst später angepasst, um Fotos zu bearbeiten. Wenn man ihnen ein Foto gibt, neigen sie dazu, es basierend auf ihrem Training komplett neu zu „erfinden“.
    • Die Analogie: Denken Sie an diese wie an einen Maler, der ein Foto betrachtet und eine neue Version davon malt. Er fängt vielleicht die allgemeine Stimmung ein, aber er verändert die Pinselstriche und Details erheblich. Dabei wäscht er Ihren unsichtbaren Tinten-Fingerabdruck weg und ersetzt ihn durch seine eigene „Künstlersignatur“.

2. Das Training zählt mehr als die Marke

Die überraschendste Erkenntnis war, dass die „Marke“ oder die spezifische Art der Technologie (wie etwa, ob es sich um ein Diffusionsmodell oder ein Sprachmodell handelt) nicht so wichtig war wie die Trainingsmethode.

  • Selbst wenn zwei KIs dieselbe zugrunde liegende Technologie verwenden, endeten sie – wenn eine darauf trainiert war, „sorgfältig zu editieren“, und die andere, „stark zu regenerieren“ – in völlig unterschiedlichen Gruppen.
  • Die Forscher fanden heraus, dass das Wissen darüber, welche KI das Bild bearbeitet hat, 70 % des Verhaltens erklärte, während der Typ des Bildes (ein Gesicht gegenüber einer Landschaft) fast nichts erklärte (0,2 %).

3. Der „Fingerabdruck“-Test

Um herauszufinden, welche KI die Arbeit erledigt hat, nutzten die Forscher einen einfachen Test:

  1. Sie nahmen das Originalfoto (die saubere Referenz).
  2. Sie nahmen das KI-editierte Foto.
  3. Sie verwendeten ein intelligentes Computer-Vision-Tool (DINOv2), um die winzigen Unterschiede zwischen den beiden zu messen.

Das Ergebnis:

  • Wenn die KI ein „Sorgfältiger Editor“ war, waren die Unterschiede winzig und konsistent.
  • Wenn die KI ein „Starker Regenerator“ war, waren die Unterschiede groß und chaotisch.

Mit nur dieser einen Messung konnten sie korrekt erraten, welche der sechs KIs das Foto bearbeitet hatte, in etwa 51 % der Fälle. Da es sechs Optionen gab, würde man durch reines Raten nur 16 % richtig liegen. 51 % ist also eine signifikante Verbesserung.

4. Warum die „blinde“ Erkennung versagte

Die Forscher versuchten auch, die KI zu identifizieren, ohne das Originalfoto anzusehen (ein „blinder“ Test), was die Art und Weise ist, wie die meisten aktuellen KI-Detektoren funktionieren.

  • Das Ergebnis: Die blinden Detektoren versagten kläglich bei den „Sorgfältigen Editoren“. Da diese KIs das Foto so nah am Original hielten, konnten die blinden Detektoren sie nicht vom Originalbild oder voneinander unterscheiden. Sie raten im Grunde nur.
  • Die Lehre: Das „Originalfoto“ ist der Schlüssel. Ohne das Original kann man nicht erkennen, wer das sorgfältige Editing durchgeführt hat. Mit dem Original hingegen kann man es.

5. Was passiert mit der „unsichtbaren Tinte“?

Die Forscher maßen auch, wie viel ihrer speziellen „unsichtbaren Tinte“ die Reise durch die KI überlebte:

  • Gemini: Behielt etwa 98 % der Tinte.
  • Flux Kontext: Behielt etwa 80 % der Tinte (obwohl das Bild für das menschliche Auge fast identisch aussah).
  • gpt-image-1: Wischte die Tinte vollständig weg und ersetzte sie durch eigenes Rauschen.

Das Fazit

Dieses Papier legt nahe, dass wir diese Werkzeuge mit unsichtbarer Tinte nicht nur als „Verteidigung“ betrachten sollten (um zu verhindern, dass KI Kunst stiehlt). Stattdessen eignen sie sich besser als forensische Werkzeuge.

Wenn Sie das Originalfoto und ein verdächtiges KI-editiertes Foto haben, können Sie diese Methode nutzen, um zu beweisen, welche KI das Bild bearbeitet hat. Dies funktioniert jedoch nur, wenn Sie das Originalfoto zum Vergleich haben. Wenn Sie das Original nicht haben und die KI ein „Sorgfältiger Editor“ war, kann die aktuelle Technologie nicht sagen, welche KI die Änderung vorgenommen hat.

Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?

Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.

Digest testen →