Towards Attributions of Input Variables in a Coalition

Dit artikel lost het fundamentele probleem van attributieconflicten in Shapley-waardegebaseerde uitlegbare AI op door de invloed van AND-OR-interacties te analyseren en een nieuwe methode voor het vormen van betrouwbare variabele coalities voor te stellen.

Xinhao Zheng, Huiqi Deng, Quanshi Zhang

Gepubliceerd 2026-02-25
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

De "Teamwork"-theorie van AI: Waarom groepsresultaten niet altijd de som zijn van de delen

Stel je voor dat je een groep vrienden hebt die samen een taak uitvoeren, zoals het oplossen van een raadsel of het winnen van een bordspel. In de wereld van kunstmatige intelligentie (AI) proberen wetenschappers vaak uit te leggen wie precies heeft bijgedragen aan het succes van de AI. Dit heet "toewijzing" (attribution).

Deze paper, geschreven door onderzoekers van de Universiteit van Shanghai Jiao Tong, pakt een groot probleem aan: Hoe weten we of een groep variabelen (bijvoorbeeld een zin in een tekst of een groep pixels in een foto) echt samenwerkt als één team, of dat het gewoon een willekeurige verzameling losse onderdelen is?

Hier is de uitleg in simpele taal, met behulp van een paar creatieve vergelijkingen.

1. Het Probleem: De "Willekeurige Groep"

Stel je voor dat je een AI vraagt om een zin te analyseren: "Het regende katten en honden."

  • Manier A: De AI kijkt naar elk woord apart: "regende", "katten", "en", "honden".
  • Manier B: De AI kijkt naar de hele zin als één blok: "het regende katten en honden".

Het probleem is dat de AI vaak verschillende antwoorden geeft, afhankelijk van hoe je de groepen vormt. Als je de woorden apart bekijkt, krijg je een totaalresultaat. Als je ze als één groep bekijkt, krijg je een ander resultaat.
De vraag is: Waarom kloppen die twee resultaten niet met elkaar? Is de groep "katten en honden" wel een echt team, of is het gewoon een losse verzameling?

2. De Oplossing: De "AND-OR" Spelregels

De onderzoekers ontdekten dat AI-modellen (zoals neurale netwerken) werken met twee soorten interacties, die ze AND- en OR-interacties noemen.

  • De AND-interactie (Het "Alles of Niets" Team):
    Denk aan een slot met drie sleutels. Je hebt alle drie sleutels nodig om het slot open te krijgen. Als je er één mist, werkt het niet.
    • Voorbeeld: In de zin "katten en honden", werkt de AI pas als alle woorden aanwezig zijn. Als je "en" verwijdert, valt de betekenis "stormachtige regen" weg. Dit is een echte samenwerking.
  • De OR-interactie (Het "Iedereen is Welkom" Team):
    Denk aan een alarm dat afgaat als één van de sensoren wordt uitgelokt. Het maakt niet uit welke sensor het is; als er maar één is, gaat het alarm af.
    • Voorbeeld: Als een zin "saai" of "teleurstellend" bevat, voelt de AI dat het een negatief gevoel is. Het maakt niet uit of het woord "saai" of "teleurstellend" is; één van beide is genoeg.

3. De "Conflicten" (Waarom de rekenfout ontstaat)

De onderzoekers ontdekten iets fascinerends: De reden dat de resultaten niet kloppen, ligt in de "halve teams".

Stel je voor dat je een groep mensen hebt: {Anna, Bob, Charlie}.

  • De AI ziet dat Anna, Bob en Charlie samen een superkracht hebben (de AND-interactie).
  • Maar de AI ziet ook dat Anna en Bob samen een andere kracht hebben, en Bob en Charlie een derde kracht.

Als je nu vraagt: "Wat is de bijdrage van de groep {Anna, Bob}?", dan krijg je een conflict.

  • Als je Anna en Bob apart bekijkt, tellen ze hun eigen krachten op.
  • Maar als je ze als groep bekijkt, telt de AI alleen de krachten mee die alleen voor die groep gelden. De krachten die ze delen met Charlie (de "halve teams") worden in de ene berekening wel meegerekend en in de andere niet.

De paper zegt: Dit is geen fout, maar een natuurlijk gevolg van hoe AI werkt. Het is alsof je probeert de bijdrage van een voetbalspeler te meten: telt hij alleen de doelpunten die hij zelf scoort, of ook de assists die hij gaf aan een speler die er niet bij was in de specifieke berekening?

4. De Nieuwe Methode: "Eerlijke Groepen" Meten

De auteurs hebben een nieuwe manier bedacht om te meten of een groep variabelen een trouw (faithful) team is. Ze hebben drie meetinstrumenten bedacht (die we hier als "snelheidsmeters" kunnen zien):

  1. De Team-Check: Is de groep zo sterk dat ze alleen maar samenwerken en niet los van elkaar? (Hoog score = Echt team).
  2. De Rol-Check: Speelt elk lid in de groep een unieke rol binnen de groep, of is het maar een willekeurig lid?
  3. De Context-Check: Wordt de groep als één geheel gezien door de AI, of ziet de AI ze ook als losse stukjes in andere situaties?

Als een groep een hoge score krijgt op deze meters, weten we: "Ja, dit is een betekenisvolle eenheid." Als de score laag is, is het gewoon een willekeurige verzameling woorden of pixels.

5. Praktijkvoorbeelden

De onderzoekers hebben dit getest in drie verschillende werelden:

  • Taal (NLP): Ze keken naar zinnen. Bijvoorbeeld: "mesmerizing performances" (betoverende voorstellingen) bleek een echte, trouwe groep te zijn. Maar "rivaling blair" (concurrerend met Blair) bleek een slechte groep, omdat het woord "Blair" losstaat van de rest en de betekenis verstoort.
  • Beelden: Ze keken naar foto's van dieren. Een groep pixels die samen het hoofd van een paard vormde, werd herkend als een echte eenheid. Willekeurige pixels die niets met elkaar te maken hadden, scoorden slecht.
  • Go (Het bordspel): Dit was misschien wel het coolste voorbeeld. Ze gebruikten hun methode om te kijken naar patronen van stenen op een Go-bord.
    • Menselijke Go-spelers kennen bepaalde patronen (zoals "schouder-aanval").
    • De AI had ook patronen geleerd die mensen niet kenden.
    • Met hun nieuwe methode konden ze deze patronen "ontmaskeren" en zien welke groepen stenen echt samenwerkten om het spel te winnen. Het hielp zelfs professionele spelers om nieuwe strategieën te ontdekken!

Conclusie in één zin

Deze paper leert ons dat we niet zomaar kunnen aannemen dat een groep van AI-onderdelen samenwerkt als één team; we moeten eerst controleren of ze een echte "AND-interactie" hebben, anders tellen we de bijdragen verkeerd op. Het is een nieuwe manier om te begrijpen hoe AI echt "denkt" en samenwerkt.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →