All in One: Unifying Deepfake Detection, Tampering Localization, and Source Tracing with a Robust Landmark-Identity Watermark

Die vorgestellte Arbeit schlägt ein einheitliches proaktives Forensik-Framework namens LIDMark vor, das mithilfe eines neuartigen 152-dimensionalen Wasserzeichens und eines faktorisierten Kopf-Decoders Deepfake-Erkennung, Manipulationslokalisierung und Quellenspurverfolgung in einer einzigen robusten Lösung vereint.

Junjiang Wu, Liejun Wang, Zhiqing Guo

Veröffentlicht 2026-03-02
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie haben ein wunderschönes, handgemaltes Porträt. Jemand nimmt dieses Bild, schneidet die Augen heraus und klebt die Augen eines anderen darauf. Früher war es fast unmöglich zu erkennen, dass das Bild gefälscht war, oder man konnte nur sagen: „Das ist gefälscht", ohne zu wissen, wo genau die Augen getauscht wurden oder wer das Bild ursprünglich erstellt hat.

Dieses Papier stellt eine neue, revolutionäre Methode vor, die wie ein unsichtbarer, magischer Sicherheitsstempel funktioniert. Die Forscher nennen ihre Erfindung LIDMark.

Hier ist die Erklärung, wie das funktioniert, ganz einfach und mit ein paar anschaulichen Vergleichen:

1. Das Problem: Der „Reactive" (Reaktive) Kampf

Bisher waren die Detektive wie Feuerwehrleute, die erst kommen, nachdem das Haus brennt. Sie versuchen, die Spuren des Feuers (die Manipulation) zu finden. Aber da die Fälscher (Deepfakes) immer besser werden, verlieren die Detektive oft den Anschluss. Sie können oft nur sagen: „Das ist falsch", aber nicht: „Hier wurde die Nase verändert" oder „Dieses Bild stammt von Person X".

2. Die Lösung: Der „Proactive" (Proaktive) Sicherheitsstempel

Statt zu warten, bis jemand etwas fälscht, drücken die Autoren den Bildern bevor sie veröffentlicht werden, einen unsichtbaren Stempel auf.

Stellen Sie sich diesen Stempel wie einen zweischneidigen Schwert vor, das aus zwei Teilen besteht:

  • Teil A: Der geometrische Riss (Die Landmarken)
    Das ist wie eine unsichtbare Landkarte der Gesichtsmerkmale (Augen, Nase, Mund). Diese Karte ist extrem empfindlich. Wenn jemand das Bild manipuliert (z. B. die Augen austauscht), wird diese unsichtbare Landkarte beschädigt.

    • Der Trick: Das System kann diese Landkarte auch dann wiederherstellen, wenn das Bild manipuliert wurde. Es vergleicht dann: „Wie sah die Landkarte ursprünglich aus?" vs. „Wie sieht sie jetzt aus?".
    • Das Ergebnis: Wenn die Karten nicht übereinstimmen, weiß das System sofort: „Aha! Hier wurde etwas verändert!" Und da die Landkarte aus vielen Punkten besteht, kann es genau zeigen: „Nur die Augen sind falsch, der Rest ist echt."
  • Teil B: Der robuste Ausweis (Die Identität)
    Das ist wie ein unsichtbarer Barcode oder ein Ausweis, der im Bild versteckt ist. Selbst wenn das Bild stark bearbeitet, komprimiert oder durch eine KI verändert wird, überlebt dieser Ausweis.

    • Das Ergebnis: Das System kann diesen Ausweis wieder auslesen und sagen: „Dieses Bild stammt ursprünglich von User X." Das hilft, die Quelle der Fälschung zu finden.

3. Der „All-in-One" Detektiv (FHD)

Früher brauchte man für diese Aufgaben drei verschiedene Detektive: einen für die Erkennung, einen für die Ortung und einen für die Quellenanalyse. Das war ineffizient und kompliziert.

Die Autoren haben einen neuen Super-Detektiv gebaut, den sie FHD (Factorized-Head Decoder) nennen.

  • Die Analogie: Stellen Sie sich einen Koch vor, der aus einem einzigen Topf mit Zutaten (den Bildmerkmalen) gleichzeitig zwei verschiedene Gerichte zubereitet.
  • Ein Arm des Kochs (der „Regressions-Kopf") schaut sich die geometrische Landkarte an, um zu sehen, ob das Gesicht noch stimmt.
  • Der andere Arm (der „Klassifizierungs-Kopf") sucht nach dem versteckten Ausweis, um die Quelle zu finden.
  • Beide arbeiten gleichzeitig aus demselben Topf, ohne sich zu stören.

4. Warum ist das so toll?

  • Unsichtbar: Das Bild sieht für das menschliche Auge genau gleich aus. Es gibt keine sichtbaren Flecken oder Störungen.
  • Alles in einem: Ein einziges System löst drei Probleme:
    1. Ist es echt? (Ja/Nein)
    2. Wo wurde es gefälscht? (Genau auf den Augen, der Nase etc.)
    3. Wer hat es gemacht? (Die Quelle wird zurückverfolgt).
  • Robust: Selbst wenn jemand versucht, das Bild zu verwackeln, zu beschneiden oder mit einer KI zu verändern, bleibt der „unsichtbare Stempel" lesbar.

Zusammenfassung

Stellen Sie sich vor, Sie kaufen ein teures Gemälde. Statt nur ein Zertifikat zu haben, das sagt „Das ist echt", hat das Gemälde jetzt unsichtbare, magische Tinte.

  • Wenn jemand versucht, das Bild zu ändern, schmerzt die Tinte (das System erkennt die Veränderung genau an der Stelle).
  • Und egal wie sehr man das Bild bearbeitet, die Tinte zeigt immer noch den Namen des ursprünglichen Künstlers.

Mit LIDMark haben die Forscher den ersten „Alles-in-einem"-Schutzschild für Gesichter entwickelt, der nicht nur warnt, wenn etwas falsch ist, sondern auch genau sagt, wo und woher es kommt.