Locating and Editing Figure-Ground Organization in Vision Transformers

Deze studie toont aan dat in het Vision Transformer-model BEiT de perceptuele ambiguïteit tussen convex en concave vormcompletie pas in de latere lagen wordt opgelost, waarbij de aandachtshoofd L0H9 fungeert als een vroeg zaadje dat een zwakke bias naar convexiteit introduceert.

Stefan Arnold, René Gröbner

Gepubliceerd 2026-03-09
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je naar een tekening kijkt die net even niet klopt. Je hersenen proberen het beeld te "invullen" om het zinvol te maken. Soms zien we een holte als een gat (de grond), en soms als een uitstulping (het figuur). Dit noemen psychologen figuur-grond organisatie. Mensen hebben van nature de neiging om bolle vormen als "voorwerp" te zien en holle vormen als "achtergrond".

De vraag die deze auteurs zich stellen is: Hoe doet een kunstmatige intelligentie (een Vision Transformer) dit? En nog belangrijker: Waar precies in het brein van de AI gebeurt dit, en kunnen we het veranderen?

Hier is een uitleg van hun onderzoek, vertaald naar alledaags taal met een paar leuke vergelijkingen.

1. Het Experiment: De "Pijl" die niet wil samenwerken

De onderzoekers hebben een speciaal soort "pijl" getekend (een vorm die op een dartschijf lijkt).

  • Het probleem: Als je het puntje van de pijl weghaalt (maskeren), ontstaat er een conflict.
    • Optie A (Lokaal bewijs): De lijnen wijzen naar een holte. De AI zou de pijl moeten laten zoals hij is.
    • Optie B (Globale regel): De vorm lijkt op een driehoek. De AI zou de holte dicht kunnen maken en een volle driehoek kunnen tekenen.

Mensen (en blijkbaar ook deze AI) kiezen bijna altijd voor Optie B: ze maken de driehoek dicht. Ze zien de bolle vorm als het "echte" voorwerp.

2. De Autopsie: Het brein van de AI openmaken

De onderzoekers wilden niet alleen kijken wat de AI deed, maar hoe het in zijn "hersenen" (de interne lagen van het model) gebeurde. Ze gebruikten een techniek die we kunnen vergelijken met het luisteren naar een vergadering.

Stel je het model voor als een groot bedrijf met 12 verdiepingen (lagen). Op elke verdieping zitten honderden managers (de "attention heads") die discussiëren over hoe ze het beeld moeten invullen.

  • Verdieping 1 t/m 10: De discussie is nog een warboel. Niemand heeft een sterke mening. Het is een onduidelijke strijd tussen "holte" en "bol".
  • Verdieping 11 (de laatste): Plotseling is het besluit genomen. De AI kiest duidelijk voor de bolle driehoek.

3. De ontdekking: De "Geheime Zaadjes"

Het meest interessante deel is dat ze vonden dat dit besluit niet pas op het einde wordt genomen. Er is een geheime zaadzaadje dat heel vroeg wordt geplant.

Ze ontdekten één specifieke manager (een "attention head" genaamd L0H9, op de allereerste verdieping) die direct na het zien van de afbeelding fluisterend zegt: "Hé, laten we maar eens naar een bolle vorm kijken."

  • Deze manager is niet de enige die het zegt, maar hij is de eerste die de richting aangeeft.
  • Zonder deze ene manager zou de discussie misschien anders verlopen. Hij plant een subtiele bias (voorkeur) in het systeem.

4. De "Knop" om het om te draaien

Om te bewijzen dat deze ene manager echt de sleutel is, deden de onderzoekers iets heel grappigs: ze verzwakten deze ene manager.

Stel je voor dat je die ene manager in de vergaderzaan een beetje stil maakt (door zijn stemvolume te verlagen).

  • Resultaat: Zonder die "bolle" fluistering, luistert de AI ineens naar de andere kant van de vergadering.
  • De AI stopt met het maken van de volle driehoek en tekent nu de holle pijl zoals hij er werkelijk uitziet!

Dit betekent dat de "regel" dat bolle vormen voorwerpen zijn, geen onveranderlijk wet van de natuur is voor de AI. Het is een actieve keuze die door een specifiek onderdeel van het model wordt aangestuurd. Als je dat onderdeel aanraakt, verandert de perceptie van de AI.

Waarom is dit belangrijk?

Dit onderzoek is als het vinden van de bedieningsknop voor hoe een AI de wereld ziet.

  • Veiligheid: In situaties waar het belangrijk is om details te zien (zoals in de medische wereld, waar een holte misschien een tumor is en geen "leuke vorm"), kunnen we de AI nu leren om niet blindelings te vertrouwen op zijn "bolle-voorwerp" instinct.
  • Begrip: We weten nu dat AI's niet alleen "leren" door te kijken, maar dat ze interne mechanismen hebben die lijken op de psychologische regels die ook mensen gebruiken.

Kort samengevat:
De onderzoekers hebben ontdekt dat een AI, net als een mens, graag holtes dichtmaakt om een mooi, rond voorwerp te maken. Ze hebben gevonden dat dit gebeurt door één specifieke "leider" in het eerste deel van het model. Als je die leider een beetje stilhoudt, verandert de AI van mening en ziet hij de holte weer als een holte. Het bewijst dat we de perceptie van AI's kunnen sturen door hun interne "knoppen" te draaien.