Spread them Apart: Towards Robust Watermarking of Generated Content

Questo articolo propone un metodo per incorporare filigrane robuste nei contenuti generati da modelli di diffusione durante l'inferenza, senza necessità di riaddestramento, garantendo così la rilevazione della generazione e l'identificazione dell'utente anche in presenza di attacchi di rimozione o perturbazioni.

Mikhail Pautov, Danil Ivanov, Andrey V. Galichin, Oleg Rogov, Ivan Oseledets

Pubblicato 2026-03-02
📖 4 min di lettura☕ Lettura da pausa caffè

Each language version is independently generated for its own context, not a direct translation.

🎨 Il "Firma Invisibile" per le Immagini create dall'IA

Immagina che le moderne intelligenze artificiali (come quelle che creano bellissimi quadri o foto da una semplice descrizione di testo) siano dei fornai magici. Chiedi loro: "Fammi un gatto nero in stile rinascimentale" e loro, bum, ti consegnano un capolavoro.

Il problema? Oggi questi quadri sono così perfetti che è impossibile dire se sono stati dipinti da un umano o generati da un computer. Inoltre, c'è un rischio: un utente disonesto potrebbe prendere un'immagine creata dall'IA, dire "È mia, l'ho dipinta io!" e venderla, rubando i diritti d'autore.

Gli autori di questo studio hanno inventato un metodo per risolvere il problema. Lo chiamano "Spread them Apart" (in italiano: Allontanateli).

Ecco come funziona, passo dopo passo, con delle metafore:

1. Il Concetto: L'Impronta Digitale Nascosta

Immagina che ogni volta che un utente chiede un'immagine al "fornaio magico" (il modello di IA), il sistema gli assegni una chiave segreta unica, come un codice fiscale invisibile.
L'obiettivo è inserire un filigrana digitale (un marchio d'acqua) dentro l'immagine stessa mentre viene creata, non dopo. È come se il fornaio, mentre impasta la pizza, inserisse un granello di sale speciale che solo lui sa dove cercare.

2. La Magia: "Allontanateli" (Spread them Apart)

Come inseriscono questo marchio? Non scrivono "Questo è di Mario" in piccolo. Usano un trucco matematico molto intelligente basato sul confronto tra due punti.

  • L'analogia della bilancia:
    Immagina che l'immagine sia una bilancia con due piatti. Il sistema sceglie due pixel (due punti dell'immagine) a caso, diciamo un punto rosso e un punto blu.

    • Se il codice segreto dice "0", il sistema assicura che il punto rosso sia più luminoso del blu.
    • Se il codice dice "1", assicura che il punto rosso sia più scuro del blu.

    Il trucco è che il sistema non si limita a farli diversi; li allontana l'uno dall'altro in modo significativo (come dice il titolo). Se il rosso è 100 e il blu è 50, il sistema li spinge a diventare 120 e 30.
    Perché? Perché se qualcuno prova a modificare l'immagine (ad esempio, rendendola più luminosa o più scura), entrambi i punti cambieranno, ma la loro differenza relativa rimarrà intatta. È come se due amici camminassero tenendosi per mano: se un vento forte li spinge, si muovono insieme, ma la distanza tra loro resta la stessa.

3. Robustezza: Perché non si cancella?

Molti metodi di filigrana vengono cancellati se cambi la luminosità, il contrasto o se compri un filtro su Instagram.
Il metodo "Spread them Apart" è come un tatuaggio fatto sotto pelle invece di un adesivo sulla superficie.

  • Se provi a sbiadire l'immagine (ridurre il contrasto), la differenza tra i due punti rimane.
  • Se provi a capovolgerla (inversione dei colori), il sistema è progettato per riconoscere anche questo.
  • È così forte che resiste persino a tentativi molto sofisticati di "pulizia" dell'immagine fatti da hacker esperti.

4. La Rivelazione: Chi ha creato l'immagine?

Quando l'immagine finisce in giro su internet, il proprietario del modello (il "fornaio") può controllarla.

  1. Prende la sua chiave segreta (che sa quali punti confrontare).
  2. Guarda l'immagine: "Il punto A è più scuro del punto B? Sì. Quindi il bit è 1. Il punto C è più chiaro del punto D? No. Quindi il bit è 0".
  3. Ricostruisce il codice segreto. Se il codice corrisponde a quello di "Mario", allora l'immagine è stata generata da Mario. Se non corrisponde a nessuno, è un falso o un'immagine non generata da quel sistema.

5. Il Trucco Finale: Tre Chiavi invece di una

Per rendere il sistema ancora più invincibile contro le rotazioni (girare l'immagine) o gli spostamenti, gli autori hanno aggiunto un livello extra.
Invece di guardare solo i pixel normali, guardano anche l'immagine attraverso "lenti speciali" matematiche (trasformate di Fourier) che non cambiano se l'immagine viene ruotata o spostata.
È come se avessero messo il marchio d'acqua:

  1. Sulla superficie della torta (i pixel).
  2. Nella ricetta della torta (la struttura matematica).
  3. Nel profumo della torta (le invarianti matematiche).

Così, anche se qualcuno taglia la torta o la gira, il profumo e la ricetta rivelano sempre chi l'ha fatta.

In Sintesi

Questo paper ci dice: "Non preoccupatevi, possiamo mettere un'etichetta invisibile e indelebile dentro le immagini create dall'IA, direttamente mentre vengono create. È come se ogni immagine avesse un DNA segreto che rivela chi l'ha generata, anche se qualcuno prova a modificarla, sbiadirla o ruotarla."

Questo aiuta a combattere le truffe, proteggere il copyright e capire quando stiamo guardando una realtà o una finzione digitale.

Ricevi articoli come questo nella tua casella di posta

Digest giornalieri o settimanali personalizzati in base ai tuoi interessi. Riassunti Gist o tecnici, nella tua lingua.

Prova Digest →