Erase at the Core: Representation Unlearning for Machine Unlearning

O artigo apresenta o framework "Erase at the Core" (EC), uma abordagem plug-in e agnóstica a modelos que supera o esquecimento superficial ao garantir a eliminação de informações não apenas nas saídas, mas também nas representações internas profundas da rede, utilizando aprendizado contrastivo e supervisão profunda em múltiplas camadas.

Jaewon Lee, Yongwoo Kim, Donghyun Kim

Publicado 2026-03-02
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem um cozinheiro de elite (a Inteligência Artificial) que aprendeu a cozinhar milhões de receitas. Um dia, alguém pede para o cozinheiro esquecer completamente uma receita específica de "Bolo de Cenoura", porque a pessoa que a ensinou pediu para apagar os dados dela.

A maneira mais segura de fazer isso seria demitir o cozinheiro e contratar um novo, ensinando-o apenas com as outras 999.999 receitas. Mas isso é caro e demorado demais.

Então, os cientistas criaram métodos "rápidos" para tentar apagar essa receita da mente do cozinheiro atual. O problema? A maioria desses métodos faz apenas uma ilusão de ótica.

O Problema: "Esquecimento Superficial"

Imagine que você pede ao cozinheiro para fazer um bolo de cenoura.

  • O método antigo: O cozinheiro diz "Não sei fazer" e entrega um bolo de chocolate. Para quem prova, parece que ele esqueceu.
  • A realidade: Mas, se você olhar dentro da cabeça dele, os ingredientes ainda estão lá! Ele ainda sabe exatamente como misturar a cenoura, o açúcar e o óleo. Ele apenas decidiu não usar essa informação na hora de entregar o prato final.

Se um "detetive" (um hacker) perguntar de forma inteligente, ou pedir para o cozinheiro apenas lembrar como fazer o bolo (sem entregá-lo), ele consegue recuperar a receita facilmente. Isso é o que os autores chamam de "Esquecimento Superficial". O modelo parece ter esquecido na saída, mas a memória ainda está viva lá no fundo.

A Solução: "Apagar no Núcleo" (Erase at the Core - EC)

Os autores deste artigo, Jaewon Lee e sua equipe, propõem uma solução chamada EC (Apagar no Núcleo).

Pense no cérebro do cozinheiro como uma fábrica de produção com várias esteiras (camadas):

  1. Esteira 1: Pega os ingredientes crus (imagens).
  2. Esteira 2: Corta e pica.
  3. Esteira 3: Mistura e tempera.
  4. Esteira 4: Assa e finaliza o prato.

Os métodos antigos tentavam apenas mudar o que acontece na Esteira 4 (o prato final). Eles diziam: "Não sirva bolo de cenoura". Mas as esteiras 1, 2 e 3 ainda estavam processando cenouras da mesma forma.

O EC é diferente. Ele vai até o coração da fábrica e instala supervisores em todas as esteiras.

Como funciona a analogia do EC:

  1. O Supervisores em Todas as Etapas: O EC coloca pequenos "olhos" (módulos auxiliares) em cada etapa do processo de aprendizado, não só no final.
  2. A Regra de Ouro:
    • Para os alunos que devem ser esquecidos (o Bolo de Cenoura): O supervisor diz: "Pare de tratar isso como cenoura! Misture isso com os ingredientes de outros bolos. Transforme a cenoura em algo que pareça um bolo de chocolate ou de maçã". Isso acontece em todas as etapas, desde o corte até a assadeira.
    • Para os alunos que devem ser mantidos (o Bolo de Chocolate): O supervisor diz: "Continue fazendo isso perfeitamente. Não toque na receita do chocolate".
  3. O Resultado: Quando o modelo tenta lembrar do "Bolo de Cenoura", ele não encontra mais nenhum traço de cenoura em nenhuma parte do processo. A estrutura interna foi reescrita. Não é apenas uma mudança de resposta final; é uma mudança na essência do que o modelo aprendeu.

Por que isso é importante?

  • Privacidade Real: Se você pede para uma empresa apagar seus dados, você quer que a IA realmente esqueça, não apenas que finja esquecer. O EC garante que a "memória" dos seus dados seja destruída de verdade.
  • Segurança: Impede que hackers usem truques para recuperar os dados esquecidos, porque a informação não está mais lá para ser recuperada.
  • Versatilidade: O EC funciona como um "plug-in". Você pode pegar qualquer método de esquecimento existente e adicionar o EC para torná-lo muito mais forte, sem precisar reescrever todo o sistema.

Resumo em uma frase

Enquanto os métodos antigos apenas tampam a boca do modelo para que ele não fale sobre os dados esquecidos, o método EC (Apagar no Núcleo) reorganiza a mente do modelo, garantindo que a informação seja apagada de verdade, desde os detalhes mais simples até as conclusões mais complexas.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →