Either a Confidence Interval Covers, or It Doesn't (Or Does It?): A Model-Based View of Ex-Post Coverage Probability

Dit artikel betoogt dat de strikte Neymaniaanse interpretatie van betrouwbaarheidsintervallen als louter 'wel of niet' dekkend onhoudbaar is, en pleit voor een modelgebaseerd perspectief waarbij ex-post dekkingskansen als voorspellende waarschijnlijkheid kunnen worden beschouwd.

Scott Lee

Gepubliceerd 2026-03-06
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Titel: Het is of het niet? Waarom een "vertrouwensinterval" meer kan betekenen dan alleen "ja of nee"

Stel je voor dat je een magische doos hebt die elke keer een geschenkje uitpakt. Soms zit er een echte diamant in (de waarheid), en soms zit er een nepje in. De maker van de doos zegt: "Ik heb deze doos zo ontworpen dat 95% van de tijd dat je een geschenkje uitpakt, het een diamant is."

Dit is precies hoe statistici werken met vertrouwensintervallen (confidence intervals). Het is een methode om een schatting te maken van iets onbekends (zoals de gemiddelde lengte van mensen of de kans op een ziekte).

De traditionele regel, bedacht door de wiskundige Neyman, luidt als volgt:

"Zodra je het geschenkje uit de doos hebt gehaald en het op de tafel hebt gelegd, is het ofwel een diamant, ofwel een nepje. Er is geen 'misschien' meer. Je kunt niet zeggen dat er 95% kans op is dat dit specifieke geschenkje een diamant is. Of het is het, of het is het niet."

De auteur van dit artikel, Scott Lee, zegt echter: "Wacht even, dat klinkt alsof we onze eigen regels vergeten." Hij vindt dat die "ja-of-nee"-regel te streng is en dat we in de praktijk best wel kunnen praten over de kans dat een specifiek resultaat klopt, zelfs nadat het al is gebeurd.

Hier is de uitleg in drie simpele stappen, met behulp van een paar verhaaltjes:

1. Het probleem met "Ja of Nee" (De Dokter en de Kat)

Stel je voor dat je dokter bent. Een patiënt komt binnen met koorts. Je doet een snelle test. De test is positief.

  • De strenge regel: De patiënt heeft ofwel griep, ofwel niet. De test is al gedaan. Er is geen "kans" meer. Je kunt dus niet zeggen: "Er is 80% kans dat ze griep heeft." Je moet wachten tot je 100% zeker weet of ze het heeft (wat vaak onmogelijk is).
  • Het probleem: Als je dit echt zou doen, zou je nooit een medicijn voorschrijven. Je zou zeggen: "Ik weet het niet, dus ik doe niets." Dat is belachelijk in de echte wereld. We gebruiken die 80% kans juist om beslissingen te nemen!

De analogie van de kat:
Stel, je hebt een doos met snoepjes. 75% is vis, 25% is kip. Je kat, Sophie, eet er één en slaapt daarna.

  • De strenge regel zegt: "De snoep is óf vis óf kip. Er is geen kans meer."
  • Maar jij, als eigenaar, weet niet welke het was. Je wilt weten: "Is het waarschijnlijk dat ze een vis-snoepje heeft gegeten?"
  • Als je de strenge regel volgt, kun je die vraag niet beantwoorden. Maar je weet wel dat het vis-snoepje 75% van de tijd in de doos zat. Je kunt dus best zeggen: "Op basis van wat ik weet, is de kans groot dat het vis was."

Lee zegt: Waarom zouden we bij statistiek (vertrouwensintervallen) anders doen dan bij een dokter of een kat? Als we de "ja-of-nee"-regel te streng nemen, maken we onze eigen modellen nutteloos.

2. De oneindige trein (De wiskundige achtergrond)

Stel je een trein voor die oneindig lang is. Elke wagon is een experiment.

  • Voor het experiment: De machinist zegt: "In 95% van de wagons zit een diamant." Dit is de ontwerpkans. Dit is de regel die we volgen.
  • Na het experiment: Je loopt door de trein en kijkt in wagon #42. Je ziet: "Ah, hier zit een diamant!"
    • De strenge regel zegt: "Kijk, wagon #42 heeft een diamant. De kans is nu 100% (of 0% als er geen diamant was). Stop met praten over kansen."
    • Lee zegt: "Nee, wacht. Je kijkt naar wagon #42, maar je bent nog steeds in dezelfde trein. De regel van de machinist (95%) geldt nog steeds voor de trein als geheel. Je kunt best zeggen: 'Op basis van hoe deze trein werkt, was de kans dat wagon #42 een diamant zou zijn, 95%.'"

Het punt is: De kans verdwijnt niet omdat je gekeken hebt. De kans was een eigenschap van het proces (de trein), niet van het object (de wagon). Zolang je het proces begrijpt, kun je over kansen praten, zelfs als je al weet wat er in de wagon zit (maar je weet het misschien nog niet!).

3. De oplossing: Drie lagen van vertrouwen

Lee stelt voor dat we drie verschillende manieren van kijken moeten onderscheiden, in plaats van maar één strenge regel:

  1. De Ontwerplagen (De Trein): "Deze methode werkt 95% van de tijd." Dit is wat statistici altijd zeggen. Dit is de lange termijn.
  2. De "Gods-oog" laag (De Wagon): "Deze specifieke wagon heeft een diamant." Dit is 100% waar of 100% onwaar. Dit is wat de strenge regel zegt.
  3. De Voorspellingslaag (Jouw Oog): "Ik heb net een wagon gezien, maar ik weet niet of het een diamant is. Op basis van hoe de trein werkt, is de kans dat deze wagon een diamant is, 95%."

De conclusie:
De strenge regel (alleen "ja of nee") is te beperkt. Het is alsof je zegt: "Omdat ik weet dat de trein bestaat, mag ik niet meer praten over de kans dat een wagon vol zit."

Lee zegt dat we die "voorspellingslaag" (nummer 3) weer mogen gebruiken. Als een arts een diagnose stelt, of als een wetenschapper een interval berekent, mogen ze zeggen: "Op basis van mijn model, is de kans groot dat dit klopt." Ze hoeven niet te wachten tot ze "God" zijn en alles 100% zeker weten.

Samengevat in één zin:
Vertrouwensintervallen zijn niet alleen een statische "ja-of-nee" stempel die je na het experiment mag vergeten; ze zijn een levendige voorspelling die ons helpt beslissingen te nemen, zelfs als we nog niet alles zeker weten. De "kans" is niet verdwenen, hij zit gewoon in de manier waarop we naar de data kijken.