Locating and Editing Figure-Ground Organization in Vision Transformers

O artigo demonstra que a organização figura-fundo no modelo Vision Transformer BEiT, que favorece naturalmente a conclusão convexa, é resolvida abruptamente nas camadas finais e pode ser alterada para permitir conclusões côncavas através da modulação de uma única cabeça de atenção específica (L0H9).

Stefan Arnold, René Gröbner

Publicado 2026-03-09
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você está olhando para um desenho abstrato. De um lado, ele parece um triângulo sólido e perfeito. Do outro, parece um "dardo" com um recorte na ponta. O seu cérebro tem que decidir: "Isso é um triângulo com um buraco ou um dardo?"

Na psicologia, isso é chamado de organização figura-fundo. Nosso cérebro humano tem um "vício" natural: tende a ver formas convexas (como bolinhas ou triângulos cheios) como objetos principais (a "figura") e as partes côncavas (as partes que "entraram" ou recuaram) como apenas o fundo.

Este artigo de pesquisa pergunta uma coisa fascinante: Os computadores (especificamente uma inteligência artificial chamada Vision Transformer) têm esse mesmo "vício"? E se tiverem, onde exatamente, dentro do "cérebro" da máquina, essa decisão é tomada?

Aqui está a explicação simples do que eles descobriram:

1. O Grande Desafio: O Dardo vs. O Triângulo

Os pesquisadores criaram um teste especial. Eles pegaram uma forma que poderia ser interpretada de duas maneiras:

  • Visão Local (O Dardo): Olhando apenas para a ponta, parece um dardo com um recorte.
  • Visão Global (O Triângulo): Olhando para o conjunto todo, parece um triângulo com um pedaço faltando.

Eles "esconderam" a parte do recorte na imagem e pediram para a IA (chamada BEiT) adivinhar o que estava lá. A IA precisava escolher: completar o triângulo (convexidade) ou manter o recorte do dardo (concavidade).

Resultado: A IA, assim como os humanos, quase sempre escolheu completar o triângulo. Ela "preferiu" a forma convexa.

2. A Autópsia do Cérebro da IA

Agora vem a parte mágica. Os pesquisadores não queriam apenas saber que a IA escolheu o triângulo; eles queriam saber como e onde ela tomou essa decisão. Eles usaram uma técnica chamada "Atribuição de Logit", que é como fazer uma autópsia em tempo real das camadas de pensamento da IA.

Eles descobriram que a decisão não acontece de uma vez só. É um processo de duas etapas:

  • O Início (Camadas Iniciais): No começo do processamento, a IA está confusa. É como se ela estivesse em um estado de "bistabilidade", equilibrada na corda bamba, sem saber se é um dardo ou um triângulo.
  • O Gatilho (A Semente): Mas, quase imediatamente, uma pequena parte da IA começa a sussurrar: "Ei, acho que é um triângulo!". Eles encontraram uma peça específica, chamada de cabeça de atenção L0H9 (pense nela como um pequeno "semeador" ou "gatilho" no início do processo).
  • A Tempestade (Camadas Finais): À medida que a informação passa pelas camadas seguintes, essa pequena preferência inicial se amplifica. Outras partes da IA começam a discutir (algumas defendem o dardo, outras o triângulo), mas a "semente" inicial faz com que a opinião do triângulo se torne mais forte até que a IA tome uma decisão definitiva.

3. A Cirurgia: Mudando a Mente da IA

A parte mais impressionante do estudo foi quando eles decidiram editar esse processo.

Eles pegaram aquele pequeno "gatilho" inicial (a cabeça L0H9) e simplesmente diminuíram o volume dele (como se desligassem o microfone desse sussurrador inicial).

O que aconteceu?
A IA mudou de ideia! Sem aquele pequeno empurrão inicial para o triângulo, a IA começou a confiar mais nas evidências locais e passou a ver o dardo com o recorte.

A Analogia Final: O Maestro e a Orquestra

Pense na IA como uma orquestra tocando uma música:

  • A Música: É a decisão de ver um triângulo ou um dardo.
  • A Orquestra: São todas as camadas e partes da IA trabalhando juntas.
  • O Maestro (L0H9): É aquele pequeno "gatilho" no início.

Normalmente, o Maestro levanta a mão e diz "Vamos tocar a música do Triângulo!". A orquestra inteira segue o comando, e mesmo que alguns músicos queiram tocar o "Dardo", o comando do Maestro é forte o suficiente para que todos toquem o Triângulo.

O que os pesquisadores fizeram foi baixar o volume do Maestro. Sem aquele comando inicial forte, a orquestra ouviu os músicos que queriam tocar o "Dardo" e a música mudou.

Por que isso importa?

Isso prova que a "intuição" da IA não é um mistério mágico ou uma regra fixa de pedra. É um processo mecânico que pode ser encontrado, entendido e até ajustado.

Isso é crucial para áreas como medicina. Imagine uma IA analisando um raio-X. Se ela tiver um "vício" de ver formas convexas, ela pode ignorar um tumor pequeno e irregular (concavo) porque sua "semente" interna prefere formas redondas. Sabendo onde essa decisão acontece, os cientistas podem "desligar" esse viés para garantir que a IA preste atenção aos detalhes importantes, não apenas ao que ela "acha" que deve ver.

Resumo: A IA tem um preconceito natural de ver formas arredondadas. Esse preconceito começa com um pequeno "sussurro" no início do processamento. Se você silenciar esse sussurro, a IA muda sua percepção e vê a realidade de forma diferente.