Locating and Editing Figure-Ground Organization in Vision Transformers

Lo studio individua come il modello Vision Transformer BEiT risolva l'ambiguità figura-sfondo favorendo la completamento convesso, un processo guidato da unità funzionali identificabili come l'attenzione L0H9 che risolve il conflitto percettivo negli strati finali.

Stefan Arnold, René Gröbner

Pubblicato 2026-03-09
📖 4 min di lettura☕ Lettura da pausa caffè

Each language version is independently generated for its own context, not a direct translation.

🎨 Il Grande Dibattito: Cosa vede l'occhio dell'AI?

Immagina di guardare un'immagine strana: un triangolo che ha un "bordo" mancante, come se fosse stato morso da un insetto.

  • La tua mente umana tende a vedere due cose diverse: o un triangolo solido (la parte mancante è solo uno sfondo) oppure una forma strana e concava (il "morso" è reale).
  • Gli esseri umani hanno un trucco nel cervello: tendono a vedere le forme "gonfie" o convesse come oggetti principali (il "figura") e le parti "incavate" come sfondo. È come se il nostro cervello dicesse: "Se è rotondo e sporge, è un oggetto! Se è scavato, è solo il vuoto dietro".

Gli autori di questo studio, Stefan e Rene, si sono chiesti: anche le Intelligenze Artificiali (in particolare i "Vision Transformers") hanno questo stesso trucco nel cervello? E se sì, dove esattamente, nel loro "cervello digitale", avviene questa decisione?

🔍 L'Esperimento: Il "Dardo" Confuso

Per scoprirlo, hanno creato un esperimento ingannevole usando delle forme chiamate "dardi" (quadrilateri non convessi).
Hanno preso queste forme e hanno coperto con un cerchio grigio la parte che crea il conflitto: quella zona che potrebbe essere interpretata sia come un triangolo pieno (convesso) sia come un buco (concavo).

Poi hanno chiesto all'AI (un modello chiamato BEiT): "Riempi il buco grigio. Cosa vedi?"

  • Se l'AI disegna un triangolo perfetto, significa che ha scelto la convessità (ha ignorato il "morso").
  • Se l'AI disegna la forma originale con il "morso", significa che ha scelto la concavità (ha seguito la forma locale).

🧠 La Scoperta: Il "Cervello" dell'AI è un Teatro

Hanno scoperto che l'AI, proprio come noi, preferisce quasi sempre vedere il triangolo perfetto (la convessità). Ma la parte affascinante è come arriva a questa decisione.

Hanno usato una sorta di "raggi X" digitali (chiamati Logit Attribution) per guardare dentro gli strati del cervello dell'AI, strato per strato.

  1. Gli Strati Iniziali (Il Caos): All'inizio, il cervello dell'AI è confuso. È come un'aula scolastica dove tutti gli studenti stanno discutendo. Alcuni dicono "è un triangolo!", altri "è un morso!". Non c'è un vincitore chiaro.
  2. Il "Seme" Segreto (L0H9): Hanno scoperto che c'è un unico piccolo gruppo di neuroni (chiamato testa di attenzione L0H9) che agisce quasi subito, all'inizio del processo. Questo gruppo è come un seme velenoso o un cattivo consigliere che sussurra all'AI: "Ehi, guarda, è più probabile che sia un triangolo!".
    • Questo seme non è un ordine forte, è solo un piccolo bias (un pregiudizio) che si pianta all'inizio.
  3. La Competizione Finale: Man mano che l'informazione passa attraverso gli strati successivi, questo piccolo seme cresce. Alla fine, il "triangolo" vince la competizione contro il "morso".

🎚️ L'Intervento: Spegnere il "Seme"

La parte più magica è che hanno potuto manipolare questo processo.
Hanno preso quel singolo "seme" (la testa L0H9) e hanno abbassato il volume del suo segnale (come se lo stessero zittendo).

Risultato?
L'AI ha cambiato idea!

  • Prima: vedeva un triangolo perfetto.
  • Dopo aver zittito il seme: ha iniziato a vedere il "morso" reale.

È come se avessero tolto il bias dall'AI, permettendole di vedere la realtà locale (il buco) invece di imporre la sua regola globale (il triangolo).

💡 Perché è Importante? (La Metafora del Filtro)

Immagina che l'AI sia un detective.

  • Il detective ha una regola fissa: "Se vedi una forma strana, è quasi sicuramente un oggetto rotondo".
  • Questo è utile per la maggior parte delle cose, ma in casi speciali (come in medicina, per vedere un tumore che ha una forma strana e irregolare), questa regola può essere pericolosa. Il detective potrebbe ignorare il tumore perché "non sembra un oggetto rotondo".

Questo studio ci dice che non dobbiamo accettare le regole dell'AI come leggi immutabili della natura. Possiamo trovare esattamente dove e come queste regole vengono applicate e, se necessario, spostarle. Possiamo "sintonizzare" l'AI per essere più attenta ai dettagli locali quando serve, invece di accecarla con le sue generalizzazioni.

In Sintesi

Gli autori hanno dimostrato che l'AI non "vede" magicamente le forme come noi, ma esegue una serie di calcoli in cui un piccolo gruppo di neuroni all'inizio lancia un piccolo pregiudizio verso le forme "gonfie". Se spegniamo quel piccolo gruppo, l'AI smette di essere "testarda" e inizia a vedere la realtà così com'è. È un passo enorme per rendere l'intelligenza artificiale più controllabile e sicura.