VISIONLOGIC: From Neuron Activations to Causally Grounded Concept Rules for Vision Models

VisionLogic is een nieuw neuraal-symbolisch raamwerk dat causaal onderbouwde concepten en logische regels genereert om het besluitvormingsproces van visuele modellen op een betrouwbaar en menselijk begrijpelijk niveau te verklaren.

Chuqin Geng, Yuhe Jiang, Ziyu Zhao, Haolin Ye, Anqi Xing, Li Zhang, Xujie Si

Gepubliceerd 2026-02-25
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een zeer slimme, maar mysterieuze kunstenaar hebt die elke foto die je hem geeft, perfect kan herkennen. Hij ziet een hond en zegt: "Dat is een husky!" Maar als je vraagt: "Waarom?", dan knikt hij alleen maar en zegt: "Omdat ik het zo voel." Hij is een zwart doosje. Je weet wat hij doet, maar niet hoe of waarom.

Dit is het probleem met moderne kunstmatige intelligentie (AI) voor beeldherkenning. Ze zijn zo goed, maar zo ondoorzichtig.

Deze paper introduceert VISIONLOGIC, een nieuwe manier om deze AI's niet alleen te laten zien wat ze zien, maar om uit te leggen waarom ze een beslissing nemen, en wel op een manier die we kunnen vertrouwen.

Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Het probleem: De "Valse Vrienden"

Tot nu toe probeerden wetenschappers de AI te begrijpen door te kijken naar statistieken. Ze zeiden bijvoorbeeld: "Kijk, elke keer als de AI een koe ziet, licht er een bepaald stukje van de foto op waar het gras is. Dus de AI denkt: gras = koe."

Maar dit is gevaarlijk! Stel je voor dat je een foto van een koe in de wei ziet. De AI denkt misschien: "Ah, gras!" en concludeert daaruit dat het een koe is. Maar als je een foto van een schaap in dezelfde wei ziet, denkt de AI misschien ook: "Gras! Dus dit is ook een koe."
De AI heeft een valse vriend gevonden: gras en koeien komen vaak samen voor, maar gras veroorzaakt niet dat het een koe is. Dit is een correlatie, geen oorzaak. De oude methoden konden dit onderscheid niet maken.

2. De oplossing: VISIONLOGIC (De Detective)

VISIONLOGIC is als een slimme detective die niet alleen kijkt naar wat er aanwezig is, maar actief test wat er gebeurt als je iets weghaalt. Het werkt in drie stappen:

Stap 1: Van "Gedachten" naar "Regels" (De Vertaler)

De AI heeft duizenden interne "neuronen" (zoals kleine gedachten) die allebei aan en uit gaan. VISIONLOGIC pakt deze chaotische gedachten en vertaalt ze naar simpele ja/nee-regels.

  • Voorbeeld: In plaats van "neuron 452 is 0.87 aan", zegt VISIONLOGIC: "Is er een puntige oor? JA." of "Is er een staart? JA."
    Het maakt van de complexe wiskunde een lijstje met duidelijke, logische regels.

Stap 2: De "Koffie-Test" (Het Causale Bewijs)

Dit is het meest unieke deel. Om te bewijzen dat een regel echt belangrijk is, doet VISIONLOGIC een experiment.
Stel je voor dat je een schilderij hebt en je wilt weten of de rode vlek in het midden de reden is dat het een "sfeervolle avond" is.

  • De oude methode: Kijkt naar het schilderij en zegt: "Er is een rode vlek, dus het is sfeervol."
  • De VISIONLOGIC methode: Neemt een kwast en veegt de rode vlek weg (vervanging door ruis).
    • Als het schilderij nu niet meer als "sfeervolle avond" wordt gezien, dan was die rode vlek echt de oorzaak.
    • Als het schilderij er nog steeds "sfeervol" uitziet, was de rode vlek misschien gewoon toeval.

VISIONLOGIC doet dit automatisch en heel snel. Het veegt stukjes van de foto weg en kijkt of de AI nog steeds dezelfde conclusie trekt. Alleen de stukjes die echt nodig zijn, worden bewaard als "waarheid".

Stap 3: De Regels Samenvoegen (De Recept)

Uiteindelijk heeft VISIONLOGIC een lijstje met bewezen regels voor elke categorie.

  • Voor een "Hond": "Moet een snuit hebben (ja) EN een staart (ja) EN geen wolvenoren (nee)."
  • Voor een "Wolf": "Moet een puntige snuit hebben (ja) EN grote oren (ja)."

Deze regels zijn causaal onderbouwd. De AI heeft bewezen dat als je de snuit verwijdert, het geen hond meer is.

Waarom is dit geweldig?

  1. Betrouwbaarheid: Het voorkomt dat de AI op "valse vrienden" (zoals gras bij koeien) afgaat. Het leert de echte oorzaken.
  2. Menselijk begrip: Mensen kunnen deze regels lezen en begrijpen. "Ah, de AI dacht dat het een wolf was omdat hij grote oren zag." Dat is iets wat we kunnen controleren.
  3. Werkt voor iedereen: Of de AI nu een oude CNN is of een moderne Vision Transformer, VISIONLOGIC werkt voor beide.

Conclusie

VISIONLOGIC is als het geven van een recept in plaats van alleen het eindgerecht. Het zegt niet alleen "dit is een taart", maar legt uit: "Ik heb dit als taart geïdentificeerd omdat er chocolade, eieren en bloem in zaten, en als ik de chocolade weghaal, is het geen taart meer."

Het maakt de "zwarte doos" van de AI transparant, eerlijk en begrijpelijk voor ons allemaal.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →