Code Fingerprints: Disentangled Attribution of LLM-Generated Code

Este artigo propõe a Rede de Atribuição de Código Desentrelaçada (DCAN), uma abordagem baseada em aprendizado contrastivo que isola características estilísticas específicas de cada modelo para identificar a origem de código gerado por LLMs, validada por um novo benchmark de grande escala com quatro modelos e quatro linguagens de programação.

Jiaxun Guo, Ziyuan Yang, Mengyu Sun, Hui Wang, Jingfeng Lu, Yi Zhang

Publicado 2026-03-05
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um detetive particular chamado "Fingerprint" (Impressão Digital). O seu trabalho é descobrir quem escreveu um código de computador, mesmo que o código tenha sido feito por uma Inteligência Artificial (IA).

Até hoje, os investigadores conseguiam apenas dizer: "Isso foi feito por um humano" ou "Isso foi feito por uma máquina". Mas e se você precisar saber qual máquina fez isso? Foi o "Robô A" (como o ChatGPT) ou o "Robô B" (como o Claude)?

É aqui que entra o artigo que você pediu para explicar. Vamos descomplicar tudo usando analogias do dia a dia.

1. O Problema: A "Falsa Identidade" das IAs

Imagine que quatro chefs diferentes (ChatGPT, Claude, DeepSeek e Qwen) recebem a mesma receita para fazer um bolo de cenoura.

  • Todos vão usar os mesmos ingredientes básicos (cenoura, farinha, ovos).
  • Todos vão seguir os mesmos passos lógicos (misturar, assar, esfriar).

Se você provar o bolo, a lógica do sabor (a "semântica" do código) será muito parecida. É difícil dizer quem fez o quê apenas pelo gosto do bolo. Os métodos antigos tentavam adivinhar olhando para o bolo inteiro, mas como todos fazem bolos parecidos, eles se confundiam.

2. A Solução: O "DCAN" (O Detetive Especialista)

Os autores criaram um novo sistema chamado DCAN. Pense nele como um detetive muito esperto que não olha para o bolo inteiro, mas sim para como cada chef trabalha.

O segredo do DCAN é a Desentrelaçamento (Disentanglement). É como se o detetive separasse o bolo em duas caixas:

  • Caixa 1 (O que todos têm em comum): Aqui vai a receita lógica. "Preciso de farinha", "preciso de ovos". Isso é a mesma coisa para todos os chefs. O DCAN joga essa caixa de lado, porque ela não ajuda a identificar o chef.
  • Caixa 2 (O estilo único do chef): Aqui ficam as "impressões digitais" do chef.
    • O Chef A sempre usa uma colher de pau de madeira.
    • O Chef B sempre batede a massa 3 vezes antes de assar.
    • O Chef C escreve notas no caderno com uma letra muito específica.
    • O Chef D usa sempre temperos diferentes.

O DCAN foca apenas na Caixa 2. Ele ignora a lógica do bolo e olha para os "vícios" e "maneirismos" de cada IA.

3. Como eles descobriram isso? (O Laboratório)

Para treinar esse detetive, os autores precisavam de um grande laboratório. Eles criaram o maior banco de dados do mundo para esse fim:

  • Pegaram 2.869 problemas de programação (como desafios de matemática ou lógica).
  • Pediram para 4 IAs famosas resolverem esses problemas.
  • Fizeram isso em 4 linguagens de programação diferentes (Python, Java, C, Go).
  • E fizeram de duas formas: com e sem "comentários" (explicações escritas dentro do código).

No total, eles tiveram quase 92.000 códigos para analisar. Foi como ter 92.000 bolos diferentes para estudar os hábitos dos chefs.

4. O que eles descobriram? (As "Pegadas")

O estudo mostrou que cada IA tem uma "personalidade" muito forte, mesmo quando faz a mesma coisa:

  • ChatGPT: Gosta de ser mais "verboso" (escreve mais linhas), usa nomes de variáveis curtos e faz comentários mais diretos.
  • Claude: Gosta de nomes de variáveis mais longos e descritivos, e usa muitos comentários em blocos (explicações grandes).
  • DeepSeek: Tem uma preferência por certas estruturas de código e usa mais comentários explicativos detalhados.
  • Qwen: Tende a ser mais conciso e usa um estilo de nomeação específico.

É como se o ChatGPT sempre usasse um chapéu vermelho, o Claude um guarda-chuva azul, e o DeepSeek um casaco de couro. Mesmo que todos estejam fazendo a mesma tarefa, o "estilo" deles é único.

5. O Resultado Final

O sistema DCAN foi treinado para olhar apenas para o "chapéu" e o "guarda-chuva" (o estilo), ignorando o "bolo" (a lógica).

  • Precisão: O sistema conseguiu identificar qual IA fez o código com uma precisão de quase 98% quando havia comentários, e mais de 92% mesmo sem comentários.
  • Generalização: O sistema aprendeu tão bem os "maneirismos" que, se ele visse um código em uma linguagem que nunca viu antes (como Go), ele ainda conseguia adivinhar quem fez, porque os "maneirismos" da IA (como ela escreve comentários ou organiza o código) são consistentes, independente da linguagem.

Resumo em uma frase

Este artigo criou um "detetive de IA" que não tenta entender a lógica do código, mas sim identificar o "sotaque" e os "hábitos" únicos de cada Inteligência Artificial, permitindo saber exatamente qual robô escreveu aquele programa, mesmo que todos tentem parecer iguais.

Isso é crucial para segurança: se um código malicioso for encontrado, agora podemos saber qual IA o gerou, ajudando a resolver crimes digitais e garantir a responsabilidade.