RandMark: On Random Watermarking of Visual Foundation Models

O artigo "RandMark" propõe um método de marcação d'água aleatória que utiliza uma pequena rede encoder-decoder para embutir marcas digitais em representações internas de modelos fundacionais visuais, permitindo a verificação eficaz da propriedade intelectual com baixas taxas de falsos positivos e falsos negativos.

Anna Chistyakova, Mikhail Pautov

Publicado 2026-03-12
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um chef de cozinha famoso que criou uma receita secreta e incrível para um prato (o Modelo de Visão Computacional). Essa receita foi desenvolvida após anos de testes, com ingredientes caros e muito trabalho. Agora, você quer vender essa receita ou alugá-la para outros restaurantes, mas tem medo de que alguém a copie, mude um pouco o nome e venda como se fosse deles, ou até mesmo a use para abrir um restaurante concorrente sem pagar nada.

O problema é: como você prova que aquele prato (ou a inteligência artificial por trás dele) é realmente seu, mesmo que o ladrão tenha tentado esconder a origem?

É aqui que entra o RandMark, a solução proposta por Anna Chistyakova e Mikhail Pautov neste artigo.

A Ideia Principal: O "Sabor Invisível"

Geralmente, para proteger uma receita, você colocaria um selo de autenticidade na embalagem. Mas com Inteligência Artificial, não dá para colar um selo no código. Se você mudar o código para colocar o selo, pode estragar o sabor do prato (a performance do modelo).

O RandMark faz algo mais inteligente: em vez de colar um selo, eles ensinam o modelo a ter um "sabor secreto" que só aparece quando você pede um prato específico.

A Analogia do "Teste de Sabor Cego"

Imagine que o dono da IA (o chef) tem uma lista de 1.000 pratos secretos (imagens de entrada).

  1. O Treinamento (A Injeção da Marca): O chef pega essas imagens e, usando uma pequena ferramenta especial (um codificador), "injeta" uma mensagem secreta binária (como um código de barras invisível: 010101) na forma como o modelo "pensa" sobre essas imagens.

    • O truque: Eles não mudam a receita inteira. Eles apenas ajustam levemente o modelo para que, quando ele vê a imagem X, ele reaja de uma maneira muito específica que contém o código secreto.
  2. O Roubo (A Cópia Funcional): Um ladrão pega esse modelo e o treina para fazer outra coisa, como identificar carros em vez de gatos (ajuste fino) ou remove partes do modelo para torná-lo mais rápido (poda). Ele acha que, ao mudar o modelo, o segredo some.

  3. A Verificação (O Degustador): Para saber se o modelo do ladrão é realmente uma cópia do original, o dono não olha o código. Ele pega as mesmas 1.000 imagens secretas e as mostra para o modelo suspeito.

    • O modelo tenta "decifrar" a mensagem secreta.
    • Se o modelo for uma cópia (mesmo que tenha sido treinado para outra tarefa), ele ainda vai "lembrar" do sabor secreto e conseguirá decifrar a mensagem com muita precisão.
    • Se o modelo for de outra pessoa (independente), ele vai chutar aleatoriamente e a mensagem não fará sentido.

Por que isso é especial? (O "Pulo do Gato")

A grande inovação do RandMark é a aleatoriedade.

Imagine que o chef não usa apenas uma imagem, mas mil variações da mesma imagem (com um pouco de ruído, girada, com cores levemente alteradas).

  • Sem o RandMark: Se o ladrão treinar o modelo em uma tarefa diferente, ele pode "esquecer" a marca d'água específica.
  • Com o RandMark: Como a marca está espalhada de forma aleatória em muitas variações, o modelo precisa "internalizar" esse padrão de forma profunda. Mesmo que o ladrão tente mudar o modelo para outra tarefa, esse padrão aleatório permanece como uma "pegada" difícil de apagar.

É como se o chef não deixasse apenas uma assinatura no prato, mas deixasse uma assinatura em cada grão de sal, em cada gota de molho e em cada variação de temperatura. Mesmo que o ladrão tente cozinhar o prato de novo, o sabor original ainda estará lá.

O Resultado na Prática

Os autores testaram isso em modelos gigantes e modernos (como o CLIP e o DINOv2).

  • Resistência: Eles mostraram que, mesmo quando o modelo é "poda" (cortado para ficar menor) ou re-treinado para tarefas totalmente novas (como classificar produtos de e-commerce ou segmentar comida), o RandMark ainda consegue encontrar a marca.
  • Segurança: Eles provaram que o método não acusa falsamente modelos que não são cópias. Se você tem um modelo próprio, o RandMark não vai dizer que ele é do chef.

Resumo em uma frase

O RandMark é como um "tatuagem invisível" que o dono da Inteligência Artificial faz na mente do modelo usando imagens secretas. Mesmo que o ladrão tente mudar a aparência do modelo ou ensiná-lo a fazer novas tarefas, essa tatuagem permanece visível para o dono, provando que a obra é original e protegendo o investimento de quem criou a tecnologia.