Explainable embeddings with Distance Explainer

Deze paper introduceert Distance Explainer, een nieuwe methode voor het genereren van lokale, post-hoc verklaringen van embedded vectorruimtes in machine learning-modellen door attributiewaarden toe te kennen via selectieve masking en afstandsgesorteerde filtering, waarmee de transparantie en betrouwbaarheid van modellen zoals CLIP worden verbeterd.

Christiaan Meijer, E. G. Patrick Bos

Gepubliceerd 2026-03-26
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ De "Afstands-Verklarer": Waarom vindt een computer twee dingen op elkaar?

Stel je voor dat je een enorme bibliotheek hebt, maar in plaats van boeken, zitten er hier duizenden geheime codes in. Deze codes zijn gemaakt door slimme computerprogramma's (AI). In deze bibliotheek liggen dingen die op elkaar lijken dicht bij elkaar, en dingen die totaal verschillend zijn ver weg van elkaar.

  • Een foto van een bij ligt dicht bij een foto van een wesp.
  • Een foto van een fiets ligt ver weg van een foto van een auto.

Het probleem? We zien alleen de codes, niet waarom de computer ze zo heeft ingedeeld. Voor de computer is dat logisch, maar voor ons is het een zwarte doos.

De auteurs van dit artikel, Christiaan en Patrick, hebben een nieuwe tool bedacht: de Distance Explainer (Afstands-Verklarer). Hun doel? De computer dwingen om uit te leggen: "Ik heb deze twee foto's als 'op elkaar' bestempeld, omdat ze beide deze specifieke vlekken hebben."


🎭 Hoe werkt het? (De "Vermomming"-truc)

Stel je voor dat je een schilderij hebt en je wilt weten welk deel van het schilderij het belangrijkst is om het te herkennen. Je zou kunnen proberen stukjes van het schilderij af te dekken met een doekje (een masker) en te kijken of de computer nog steeds weet wat het is.

Deze nieuwe methode doet iets vergelijkbaars, maar dan met een slimme twist:

  1. De Referentie: Je hebt twee foto's. Laten we zeggen: een bij (foto A) en een vlieg (foto B). De computer vindt ze best wel op elkaar.
  2. Het Vermommen: De computer neemt foto A (de bij) en plakt er honderden verschillende, willekeurige vlekken op. Soms bedekt hij de vleugels, soms de strepen, soms de achtergrond.
  3. De Test: Elke keer dat hij een vlek bedekt, kijkt hij: "Hoe ver staan deze twee foto's nu nog van elkaar?"
    • Als hij de vleugels van de bij bedekt, zegt de computer: "Oeps! Nu lijken ze totaal niet meer op elkaar. De afstand wordt enorm!" -> Conclusie: De vleugels zijn heel belangrijk voor de gelijkenis.
    • Als hij de strepen bedekt, zegt de computer: "Nou ja, ze lijken nog steeds op elkaar." -> Conclusie: De strepen zijn minder belangrijk voor de gelijkenis (of ze maken ze juist anders).

🪞 De "Spiegel"-Truc (De slimme filter)

In het begin dachten de auteurs: "Laten we gewoon alle vlekken optellen die de afstand vergroten." Maar dat gaf een rommelig beeld.

Ze bedachten een slimme truc, alsof je twee spiegels tegenover elkaar zet:

  • Spiegel 1: Kijk naar de vlekken die de foto's dichter bij elkaar brengen (bijv. als je de achtergrond weglaat, lijken ze meer op elkaar).
  • Spiegel 2: Kijk naar de vlekken die de foto's verder uit elkaar duwen (bijv. als je de vleugels weglaat, lijken ze minder op elkaar).

Door deze twee spiegels tegen elkaar af te wegen (de ene kant aftrekken van de andere), krijgen ze een heel scherp beeld. Het is alsof je ruis uit een radio haalt door twee tegenstrijdige geluiden te combineren. Het resultaat is een heldere kaart die precies laat zien: "Hier zit de reden dat ze op elkaar lijken, en hier zit de reden dat ze verschillen."


🧪 Wat hebben ze getest?

Ze hebben hun tool getest op verschillende dingen:

  • Beeld tegen Beeld: Een bij vs. een vlieg. De tool liet zien dat de vleugels de reden waren dat ze op elkaar leken, maar de strepen waren de reden dat ze verschillend waren.
  • Beeld tegen Tekst: Een foto van een hond vs. de tekst "een labradoodle". De tool kon precies aangeven welke delen van de foto (oogjes, halsband) de computer zagen als een match met die tekst.

🏆 Is het betrouwbaar?

Ja! De auteurs hebben hun tool getest met strenge regels:

  • Stabiliteit: Als je het een beetje anders doet, verandert het antwoord niet zomaar. Het is niet willekeurig.
  • Eerlijkheid: Als je de "hersenen" van de computer (de modellen) verandert, verandert de uitleg ook. Dat betekent dat de tool echt naar de computer kijkt en niet zomaar een standaard antwoord geeft.

💡 Waarom is dit belangrijk?

Vroeger was het heel moeilijk om te begrijpen waarom een AI twee dingen als "verwant" zag. Dit was vooral een probleem bij complexe systemen die veel verschillende soorten data (beelden, tekst, geluid) door elkaar gebruiken.

Met deze Distance Explainer kunnen onderzoekers nu zien:

  • "Ah, de AI denkt dat deze twee medicijnen op elkaar lijken, omdat ze beide een specifieke chemische structuur hebben."
  • "De AI denkt dat deze twee mensen op elkaar lijken, niet vanwege hun gezicht, maar vanwege hun kleding."

Dit maakt AI transparanter en betrouwbaarder. Het is alsof je eindelijk de deuren van de zwarte doos open hebt gezet en kunt zien wat er binnenin gebeurt.

Samenvatting in één zin:

De auteurs hebben een slimme "vermomming-truc" bedacht die een computer dwingt om uit te leggen waarom hij twee dingen als op elkaar of verschillend ziet, door te kijken welke delen van de foto's of teksten die beslissing beïnvloeden.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →