Spread them Apart: Towards Robust Watermarking of Generated Content

Este artigo propõe um método de marcação d'água robusto e sem necessidade de retreinamento, aplicado durante a inferência de modelos generativos como os de difusão, para garantir a detecção de conteúdo sintético e a identificação do usuário mesmo sob ataques de remoção ou perturbações.

Mikhail Pautov, Danil Ivanov, Andrey V. Galichin, Oleg Rogov, Ivan Oseledets

Publicado 2026-03-02
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem uma máquina mágica que desenha quadros incríveis baseados apenas em uma descrição que você dá. Hoje, essas máquinas (chamadas de Modelos de Difusão, como o Stable Diffusion) são tão boas que é quase impossível dizer se uma foto foi tirada por um humano ou criada por um computador.

O problema? Alguém pode usar essa máquina para criar uma imagem, e depois mentir dizendo: "Eu desenhei isso! É minha obra-prima!", roubando o crédito ou violando direitos autorais.

É aqui que entra o artigo "Espalhe-os" (Spread them Apart). Os autores criaram um método inteligente para colocar uma "assinatura invisível" nas imagens geradas, sem precisar reprogramar a máquina mágica.

Aqui está a explicação simplificada, usando analogias do dia a dia:

1. A Ideia Principal: O "Pulo do Gato" Invisível

Em vez de tentar esconder uma marca d'água (como um logotipo transparente) na imagem, que pode ser apagada facilmente, os autores decidiram alterar a própria estrutura da imagem enquanto ela está sendo criada.

A Analogia do Sinal de Trânsito:
Imagine que a máquina de desenhar é um pintor. Normalmente, o pintor segue suas instruções e pinta o gato preto.
Com o método "Espalhe-os", o sistema diz ao pintor: "Pinte o gato, mas faça um truque específico: o olho esquerdo deve ser ligeiramente mais brilhante que o direito, e a orelha direita deve ser ligeiramente mais escura que a esquerda."

Essa diferença é tão pequena que o olho humano não percebe (a imagem continua linda), mas é uma regra matemática que só o dono da máquina conhece.

2. Como Funciona a "Chave Secreta"

Cada usuário que usa o sistema recebe uma chave secreta única.

  • O Segredo: Imagine que sua chave é um mapa que diz: "Olhe para o pixel 10 e o pixel 20. Se o pixel 10 for mais claro que o 20, significa que a imagem é sua."
  • A Geração: Quando você pede uma imagem, o sistema ajusta os pixels para obedecer ao seu mapa secreto.
  • A Verificação: Se alguém tentar roubar a imagem e dizer que é dele, o dono da máquina olha para a imagem, usa a chave secreta do suposto dono e verifica: "Ei, o pixel 10 não está mais claro que o 20 como deveria estar. Essa imagem não é sua!"

3. Por que é "Robusto" (Difícil de Apagar)?

O grande trunfo desse método é que ele é matematicamente garantido para resistir a tentativas de remoção.

A Analogia do Balão:
Imagine que a imagem é um balão e a marca d'água é um desenho feito com caneta no balão.

  • Métodos antigos: Se você esfregar o balão (ajustar brilho, contraste, cortar a imagem), o desenho some.
  • Método "Espalhe-os": O desenho não está "na tinta" do balão, mas na tensão entre dois pontos do balão. Se você tentar apertar o balão (adicionar ruído) ou mudar a cor (ajustar brilho), a relação entre os dois pontos (um estar mais esticado que o outro) permanece.

O artigo prova matematicamente que, se alguém tentar "apagar" a marca d'água com pequenas alterações (como mudar o brilho ou adicionar um pouco de ruído), a mensagem secreta continua lá. É como tentar apagar a diferença de altura entre duas torres de blocos apenas soprando ar nelas; a torre maior continua sendo a maior.

4. A Versão Avançada: "Três Marcas em Vez de Uma"

O artigo também propõe uma versão mais forte para quando alguém tenta girar ou mover a imagem (como se você pegasse a foto e a virasse de lado).

A Analogia da Receita de Bolo:

  • Versão 1 (Pixel): A marca d'água está na posição exata dos ingredientes na tigela. Se você virar a tigela, a posição muda e a marca some.
  • Versão 2 (Invariante): O sistema cria a marca d'água baseada na fórmula da receita, não na posição. Se você girar a foto (como girar um bolo), a fórmula matemática que define a marca d'água continua válida, mesmo que a imagem tenha sido rotacionada. É como dizer: "O bolo é redondo", independentemente de como você olha para ele.

5. O Resultado na Prática

Os autores testaram isso contra "ataques" que tentam apagar a marca:

  • Mudar o brilho? Falha.
  • Mudar o contraste? Falha.
  • Comprimir a imagem (como no JPEG)? Falha.
  • Tentar usar inteligência artificial para "limpar" a imagem? Falha.

Eles conseguiram manter a marca d'água quase intacta, enquanto outros métodos famosos perderam a marca d'água facilmente.

Resumo Final

O artigo "Espalhe-os" é como dar a cada usuário de uma máquina de gerar imagens uma impressão digital única e invisível que é parte da própria estrutura da imagem.

  • Para o usuário: A imagem continua perfeita.
  • Para o ladrão: É impossível remover a marca sem destruir a imagem inteira.
  • Para o dono: É fácil provar quem criou o que, mesmo anos depois.

É uma solução elegante que usa a matemática para garantir honestidade em um mundo onde "ver para crer" não é mais suficiente.