Causal Survival Analysis in Platform Trials with Non-Concurrent Controls

Dit artikel ontwikkelt een causaal overlevingsframework voor platformtrials dat aantoont dat het gebruik van alleen gelijktijdige controles met covariaat-gecorrigeerde dubbel robuuste schatters de meest robuuste strategie is om bias te voorkomen en precisie te verbeteren, in plaats van niet-gelijktijdige controles te poolen.

Antonio D'Alessandro, Samrachana Adhikari, Michele Santacatterina

Gepubliceerd Thu, 12 Ma
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een groot, dynamisch kookwedstrijd organiseert: de Platform Trial.

In een gewone kookwedstrijd (een traditioneel medisch onderzoek) heb je één jury (de controlegroep) en één kok die een nieuw recept probeert. Die jury blijft de hele wedstrijd hetzelfde. Maar in een platform trial is het anders: je kunt tijdens de wedstrijd nieuwe koks toevoegen die nieuwe recepten proberen, en je kunt oude koks weer wegsturen. De jury (de controlegroep) blijft echter wel dezelfde: ze proeven alles.

Dit is slim, want je hoeft niet elke keer een nieuwe jury te zoeken. Maar hier zit een addertje onder het gras.

Het Probleem: De "Niet-Tijdige" Juryleden

Stel, de wedstrijd duurt een jaar.

  • De Concurrenten: Koks die op maandag beginnen en de juryleden die op maandag proeven. Die juryleden hebben dezelfde smaakpapillen als de koks op dat moment.
  • De "Niet-Tijdige" (Non-Concurrent) Juryleden: Koks die pas in december beginnen. De juryleden die in januari proefden, zijn dan al weg. Maar in de data hebben we die oude juryleden nog wel staan.

De onderzoekers dachten: "Waarom gebruiken we niet alle juryleden uit de hele wedstrijd? Dat geeft meer data en een preciezer oordeel!"

Maar hier komt de tijd-drift (time drift) om de hoek kijken.
Stel, in januari was het koud en aten de juryleden zware soep. In juli is het warm en willen ze lichte salades. Als je de juryleden van januari (die zware soep proefden) combineert met die van juli (die salades proefden) om een kok te beoordelen die in maart begon, krijg je een verdraaid oordeel. De "smaak" van de jury is veranderd door de tijd, niet door het recept.

Wat doet dit papier?

De auteurs van dit papier (Antonio, Samrachana en Michele) zeggen: "Hé, wacht even. We moeten heel precies zijn over wat we eigenlijk meten."

Ze introduceren een causaal raamwerk. Dat is een manier van denken die zegt: "We willen weten wat er zou gebeuren als alleen de mensen die op hetzelfde moment als de nieuwe kok in de wedstrijd zaten, hadden geproefd."

Ze noemen dit de "Concurrente Populatie".

De Twee Manieren om te Rekenen

Het papier vergelijkt twee manieren om de resultaten te berekenen:

  1. De "Alles-in-één" Methode (Pooling): Je gooit alle juryleden (januari tot december) in één grote pot en rekent het gemiddelde.

    • Gevaar: Als je recepten (modellen) niet perfect zijn, of als de smaak van de jury echt veranderd is door de tijd, krijg je een verkeerd antwoord. Het lijkt misschien preciezer (minder ruis), maar het is bevooroordeeld (bias). Je meet dan iets anders dan wat je wilde weten.
  2. De "Strikte" Methode (Concurrent Only): Je gebruikt alleen de juryleden die op hetzelfde moment als de nieuwe kok in de wedstrijd zaten.

    • Voordeel: Je weet zeker dat je de juiste vergelijking maakt.
    • Nadeel: Je hebt minder data, dus het resultaat is soms wat "ruisiger" (minder precies).

De Oplossing: De "Dubbel Robuuste" Chef-kok

De auteurs vinden een slimme oplossing. Ze zeggen: "Gebruik alleen de concurrente juryleden, maar maak de berekening zo slim mogelijk."

Ze gebruiken een methode die ze "Doubly Robust" (Dubbel Robuust) noemen.
Stel je voor dat je een dubbel-waakzame chef-kok hebt:

  • Als de ene berekeningsmethode (bijv. gebaseerd op de ingrediënten) fout is, redt de tweede methode (gebaseerd op de kooktijd) het nog steeds.
  • Als de tweede fout is, redt de eerste het.

De grote ontdekking:
Als je deze slimme "Dubbel Robuuste" methode gebruikt, krijg je net zo'n goed resultaat als wanneer je alle oude juryleden zou toevoegen, maar dan zonder het risico op een verdraaid oordeel.

In feite zeggen ze: "Het toevoegen van de oude juryleden (niet-tijdige controles) geeft je geen extra voordeel als je deze slimme methode gebruikt. Sterker nog, het kan je zelfs in de war brengen als je niet 100% zeker bent van je modellen."

De Conclusie in Gewone Taal

  1. Wees voorzichtig met oude data: In een dynamische proef (zoals tijdens de coronapandemie) verandert de wereld (en de patiënten) snel. Het simpelweg samenvoegen van oude en nieuwe controlegroepen kan leiden tot verkeerde conclusies.
  2. Focus op het juiste moment: Vergelijk altijd de nieuwe behandeling met de mensen die op datzelfde moment in de proef zaten.
  3. Gebruik slimme statistiek: In plaats van meer data te verzamelen (door oude controles toe te voegen), gebruik je betere statistische technieken (covariaat-gecorrigeerde dubbel robuuste schatters) om de bestaande data zo goed mogelijk te benutten.

Kortom: Het is beter om een klein, scherp en eerlijk oordeel te hebben van de juiste mensen, dan een groot, wazig oordeel van iedereen die er ooit is geweest. De auteurs bewijzen dat je met de juiste statistische "bril" de beste resultaten haalt zonder de valkuil van de tijd-drift in te lopen.