Inference conditional on selection: a review

Dit artikel biedt een overzicht van selectieve inferentie, een verzameling technieken die geldige statistische conclusies mogelijk maken wanneer hypotheses of parameters op basis van de data worden geselecteerd, en illustreert de toepassing hiervan via simulaties en een analyse van single-cell RNA-sequencing-data.

Anna Neufeld, Ronan Perry, Daniela Witten

Gepubliceerd 2026-04-14
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Selectieve Inference: Waarom je niet mag "dubbel dippen" in je data

Stel je voor dat je een grote schatkaart hebt met honderden plekken waar goud zou kunnen zitten. Je wilt weten welke plek het meeste goud bevat.

In de oude, klassieke statistiek was het zo: je kiest vooraf één plek uit, graaft daar, en zegt: "Hier zit goud!" en geeft een schatting van hoeveel. Omdat je de plek al had gekozen voordat je begon te graven, kun je er zeker van zijn dat je metingen eerlijk zijn.

Maar in de moderne wetenschap doen we het vaak anders. We kijken eerst naar de hele kaart, zien waar het meeste goud lijkt te zitten (laten we zeggen plek #42), en zeggen dan: "Kijk, plek #42 heeft het meeste goud!" en geven een schatting.

Het probleem: De "Dubbel Dip" (Double Dipping)
Hier zit de valstrik. Je hebt dezelfde data gebruikt om de plek te kiezen én om de hoeveelheid goud te meten. Het is alsof je een wedstrijd organiseert, zelf de winnaar kiest op basis van wie het hardst schreeuwt, en daarna zegt: "Kijk, deze schreeuwer is de snelste!"

Omdat je de winnaar koos omdat hij het hardst schreeuwde (een toevallige piek in de data), is zijn gemeten snelheid waarschijnlijk te hoog. Je bent te optimistisch. Dit noemen ze in de statistiek de "verwensing van de winnaar" (winner's curse). Als je dit niet corrigeert, krijg je vals positieve resultaten, en dat is een van de redenen waarom veel wetenschappelijke studies niet kunnen worden gerepliceerd.

De oplossing: Selectieve Inference
De auteurs van dit artikel (Anna Neufeld, Ronan Perry en Daniela Witten) leggen uit hoe we dit kunnen oplossen. Ze introduceren een concept dat ze "selectieve inferentie" noemen. In plaats van te zeggen "Onze schatting is altijd waar", zeggen ze: "Onze schatting is waar, als we kijken naar de specifieke manier waarop we de vraag hebben gekozen."

Ze vergelijken dit met een gerechtvaardigde uitzondering. Als je een verdachte kiest omdat hij verdacht gedroeg, moet je bewijzen dat hij schuldig is, rekening houdend met het feit dat je hem om die reden hebt gekozen.

Hoe doen ze dit? Drie manieren om de "dubbel dip" te voorkomen

De paper bespreekt verschillende methoden om eerlijke antwoorden te geven, zelfs als je eerst in de data hebt gekeken. Ze gebruiken een simpele "recept" dat in drie stappen werkt:

  1. Kiezen: Je kiest je vraag (bijv. "Welke groep mensen is het ziekst?").
  2. Antwoorden: Je geeft een antwoord op die vraag.
  3. De Regel: Je mag alleen antwoorden geven als je rekening houdt met het feit dat je die vraag hebt gekozen.

Hier zijn de drie belangrijkste manieren (analogieën) die ze bespreken:

1. De "Volledige Spiegel" (Full Conditional Selective Inference)

  • Hoe het werkt: Je gebruikt je hele dataset om te kiezen én om te meten, maar je past je wiskundige formule aan. Je zegt eigenlijk: "Oké, we hebben plek #42 gekozen. Laten we nu berekenen: als we alle mogelijke datasets hadden gehad, hoe vaak zouden we dan ook plek #42 hebben gekozen? En hoe vaak zou de hoeveelheid goud daar dan zo hoog zijn geweest?"
  • Voordeel: Je gebruikt alle informatie.
  • Nadeel: Het is heel moeilijk te berekenen. Soms, als de keuze heel "moeilijk" was (bijvoorbeeld als twee plekken bijna evenveel goud hadden), wordt je antwoord zo onzeker dat je een oneindig breed interval krijgt ("Het kan 0 zijn, of het kan 1 miljard zijn"). Dat is niet erg nuttig.

2. De "Twee Teams" (Sample Splitting)

  • Hoe het werkt: Je deelt je data in tweeën. Team A (de helft van de data) kijkt naar de kaart en kiest de beste plek. Team B (de andere helft) mag alleen naar die gekozen plek kijken en de hoeveelheid goud meten. Team B heeft de kaart nooit gezien, dus ze weten niet dat ze "de winnaar" moeten meten.
  • Voordeel: Eenvoudig en eerlijk. Je kunt standaard statistiek gebruiken.
  • Nadeel: Je gooit de helft van je data weg. Team B heeft minder informatie, waardoor je metingen minder precies zijn. En als Team A een plek kiest waar Team B helemaal geen mensen heeft, kan Team B niets zeggen.

3. De "Magische Splitsing" (Data Thinning / Fission)

  • Hoe het werkt: Dit is de meest moderne en slimme methode. Je deelt de data niet fysiek in tweeën, maar je "splitst" elke datapunt in twee virtuele delen. Stel, je hebt een meting van 100. Je maakt er twee nieuwe metingen van: 50 en 50 (of 60 en 40).
    • De ene helft (50) gebruikt je om te kiezen welke plek de winnaar is.
    • De andere helft (50) gebruikt je om de hoeveelheid goud te meten.
    • Het mooie is: deze twee helften zijn wiskundisch onafhankelijk van elkaar, maar je hebt wel alle originele informatie behouden.
  • Voordeel: Je gooit niets weg, maar je bent wel eerlijk.
  • Nadeel: Het werkt alleen voor bepaalde soorten data (zoals getallen die normaal verdeeld zijn of tellingen).

Waarom is dit belangrijk?
De auteurs laten zien met voorbeelden uit de echte wereld (zoals het vinden van de beste behandeling in een medisch onderzoek, het analyseren van bomen in een bos, of het groeperen van cellen in DNA-onderzoek) dat als je deze technieken niet gebruikt, je vaak denkt dat je iets gevonden hebt, terwijl het gewoon toeval was.

Conclusie voor de leek
Wetenschap is vaak een proces van ontdekken. We kijken naar data, vinden iets interessants, en willen daar een conclusie over trekken. De oude regels zeiden: "Dat mag niet, je moet van tevoren weten wat je zoekt."
De nieuwe regels (Selectieve Inference) zeggen: "Het mag prima om te zoeken en te ontdekken, zolang je maar eerlijk bent over het feit dat je hebt gezocht. Gebruik de juiste wiskunde om te corrigeren voor je eigen nieuwsgierigheid."

Het artikel is een gids voor wetenschappers om te kiezen welke van deze "correctie-methoden" het beste past bij hun specifieke probleem, zodat ze niet per ongeluk leugens vertellen aan de wereld.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →