FunnyNodules: A Customizable Medical Dataset Tailored for Evaluating Explainable AI

Dit paper introduceert FunnyNodules, een volledig aanpasbaar synthetisch dataset met gedetailleerde annotaties van visuele kenmerken en diagnoseredenering, dat is ontworpen om de betrouwbaarheid en verklaringen van medische AI-modellen systematisch te evalueren.

Luisa Gallée, Yiheng Xiong, Meinrad Beer, Michael Götz

Gepubliceerd 2026-03-09
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

De "Gekke Knobbels": Een Speelgoedlab voor Medische AI

Stel je voor dat je een jonge arts wilt leren hoe hij longkanker moet herkennen op een röntgenfoto. Normaal gesproken zou je duizenden echte foto's van patiënten moeten laten zien. Maar dat is lastig: echte foto's zijn vaak vaag, er zijn maar weinig experts die ze kunnen uitleggen, en we weten niet altijd precies waarom de arts tot een bepaalde conclusie komt.

De auteurs van dit paper hebben een oplossing bedacht die ze FunnyNodules noemen. Het is een beetje als een LEGO-set, maar dan voor kunstmatige intelligentie (AI) die medische foto's bekijkt.

Hier is hoe het werkt, vertaald naar alledaags taal:

1. De LEGO-blokken van een longknobbeltje

In de echte wereld zijn longknobbeltjes (de plekken die artsen controleren op kanker) complex en chaotisch. Bij FunnyNodules maken de onderzoekers deze knobbeltjes niet op basis van echte patiënten, maar bouwen ze ze op met computercode.

Ze gebruiken zes "knoppen" of eigenschappen om elk knobbeltje te maken, net zoals je met LEGO-blokken een huis bouwt:

  • Rondheid: Is het een perfecte cirkel of een eivorm?
  • Prikkeling (Spiculation): Heeft het scherpe uitsteeksels (zoals een stekelige ster) of is het glad?
  • Rand: Is de rand scherp en duidelijk, of wazig en zacht?
  • Grootte: Is het klein of groot?
  • Helderheid: Is het donker of licht?
  • Binnenkant: Is er een patroon vanbinnen of niet?

Elk knobbeltje is uniek, maar de computer weet exact welke knoppen er zijn gebruikt om het te maken.

2. De "Gouden Regel" (De Antwoorden)

Het slimme aan dit spelletje is dat de onderzoekers ook de antwoorden kennen. Ze hebben een simpele, maar strikte regelboekje geschreven (een algoritme).

Stel je voor dat de regel luidt: "Als het knobbeltje heel rond is én een stekelige rand heeft, dan is het waarschijnlijk kwaadaardig."
Omdat de computer zelf het plaatje heeft gemaakt, weet hij 100% zeker of de AI het juiste antwoord heeft gegeven. In de echte wereld weten we dat vaak niet, omdat artsen het soms oneens zijn. Hier is het antwoord altijd waar.

3. Waarom is dit zo handig? (De Testbaan)

De onderzoekers gebruiken deze "Gekke Knobbels" om AI-modellen te testen, alsof ze een auto op een testbaan rijden.

  • Testen op eerlijkheid: Soms raadt een AI het juiste antwoord, maar voor de verkeerde reden. Bijvoorbeeld: hij denkt dat een knobbeltje kanker is omdat het groot is, terwijl de echte reden is dat het stekelig is. Met FunnyNodules kunnen de onderzoekers zien: "Oh, deze AI kijkt naar de grootte, maar dat is niet wat we wilden!" Het is alsof je een leerling een wiskundetoets laat maken en je ziet precies welke sommen hij fout heeft opgelost.
  • De "Vertrouwens-Index": Ze hebben een meetlat bedacht om te zien of de AI te vertrouwen is. Als de AI het juiste antwoord geeft, maar de "knoppen" (de eigenschappen) die hij gebruikt om dat te beslissen, zijn verkeerd, dan is de AI niet te vertrouwen. Het is alsof iemand een deur opent met de sleutel, maar hij heeft de sleutel per ongeluk in zijn hand gekregen terwijl hij dacht dat hij de deur open duwde.
  • Waar kijkt de AI naar? De onderzoekers kunnen zien of de AI echt naar het knobbeltje kijkt, of dat hij naar de achtergrond kijkt. Omdat ze precies weten waar het knobbeltje zit (ze hebben het zelf getekend), kunnen ze zien of de AI "kijkt" naar het juiste stukje van de foto.

4. Geen echte patiënten nodig

Het grootste voordeel is dat je geen duizenden echte patiëntenfoto's nodig hebt. Je kunt oneindig veel "Gekke Knobbels" maken, variëren in moeilijkheidsgraad en zien hoe de AI reageert.

  • Wil je weten of de AI het kan als de achtergrond rommelig is? Maak de achtergrond rommelig.
  • Wil je weten of de AI het kan als er maar weinig voorbeelden zijn? Geef de AI maar 10 foto's.

Conclusie: Een veilig oefenveld

FunnyNodules is geen vervanging voor echte medische tests. Je zou een echte dokter niet trainen op LEGO. Maar het is een perfect oefenveld om te begrijpen hoe een AI denkt.

Het helpt onderzoekers om AI-systemen te bouwen die niet alleen het juiste antwoord geven, maar dat ook doen voor de goede redenen. Zo zorgen we ervoor dat de AI's van de toekomst echt te vertrouwen zijn voor artsen en patiënten. Het is een manier om de "zwarte doos" van de AI open te maken en te kijken of er een slimme, eerlijke dokter in zit, of gewoon een gokker.