Causal Survival Analysis in Platform Trials with Non-Concurrent Controls

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een groot, dynamisch kookwedstrijd organiseert: de Platform Trial.

In een gewone kookwedstrijd (een traditioneel medisch onderzoek) heb je één jury (de controlegroep) en één kok die een nieuw recept probeert. Die jury blijft de hele wedstrijd hetzelfde. Maar in een platform trial is het anders: je kunt tijdens de wedstrijd nieuwe koks toevoegen die nieuwe recepten proberen, en je kunt oude koks weer wegsturen. De jury (de controlegroep) blijft echter wel dezelfde: ze proeven alles.

Dit is slim, want je hoeft niet elke keer een nieuwe jury te zoeken. Maar hier zit een addertje onder het gras.

Het Probleem: De "Niet-Tijdige" Juryleden

Stel, de wedstrijd duurt een jaar.

De Concurrenten: Koks die op maandag beginnen en de juryleden die op maandag proeven. Die juryleden hebben dezelfde smaakpapillen als de koks op dat moment.
De "Niet-Tijdige" (Non-Concurrent) Juryleden: Koks die pas in december beginnen. De juryleden die in januari proefden, zijn dan al weg. Maar in de data hebben we die oude juryleden nog wel staan.

De onderzoekers dachten: "Waarom gebruiken we niet alle juryleden uit de hele wedstrijd? Dat geeft meer data en een preciezer oordeel!"

Maar hier komt de tijd-drift (time drift) om de hoek kijken.
Stel, in januari was het koud en aten de juryleden zware soep. In juli is het warm en willen ze lichte salades. Als je de juryleden van januari (die zware soep proefden) combineert met die van juli (die salades proefden) om een kok te beoordelen die in maart begon, krijg je een verdraaid oordeel. De "smaak" van de jury is veranderd door de tijd, niet door het recept.

Wat doet dit papier?

De auteurs van dit papier (Antonio, Samrachana en Michele) zeggen: "Hé, wacht even. We moeten heel precies zijn over wat we eigenlijk meten."

Ze introduceren een causaal raamwerk. Dat is een manier van denken die zegt: "We willen weten wat er zou gebeuren als alleen de mensen die op hetzelfde moment als de nieuwe kok in de wedstrijd zaten, hadden geproefd."

Ze noemen dit de "Concurrente Populatie".

De Twee Manieren om te Rekenen

Het papier vergelijkt twee manieren om de resultaten te berekenen:

De "Alles-in-één" Methode (Pooling): Je gooit alle juryleden (januari tot december) in één grote pot en rekent het gemiddelde.
- Gevaar: Als je recepten (modellen) niet perfect zijn, of als de smaak van de jury echt veranderd is door de tijd, krijg je een verkeerd antwoord. Het lijkt misschien preciezer (minder ruis), maar het is bevooroordeeld (bias). Je meet dan iets anders dan wat je wilde weten.
De "Strikte" Methode (Concurrent Only): Je gebruikt alleen de juryleden die op hetzelfde moment als de nieuwe kok in de wedstrijd zaten.
- Voordeel: Je weet zeker dat je de juiste vergelijking maakt.
- Nadeel: Je hebt minder data, dus het resultaat is soms wat "ruisiger" (minder precies).

De Oplossing: De "Dubbel Robuuste" Chef-kok

De auteurs vinden een slimme oplossing. Ze zeggen: "Gebruik alleen de concurrente juryleden, maar maak de berekening zo slim mogelijk."

Ze gebruiken een methode die ze "Doubly Robust" (Dubbel Robuust) noemen.
Stel je voor dat je een dubbel-waakzame chef-kok hebt:

Als de ene berekeningsmethode (bijv. gebaseerd op de ingrediënten) fout is, redt de tweede methode (gebaseerd op de kooktijd) het nog steeds.
Als de tweede fout is, redt de eerste het.

De grote ontdekking:
Als je deze slimme "Dubbel Robuuste" methode gebruikt, krijg je net zo'n goed resultaat als wanneer je alle oude juryleden zou toevoegen, maar dan zonder het risico op een verdraaid oordeel.

In feite zeggen ze: "Het toevoegen van de oude juryleden (niet-tijdige controles) geeft je geen extra voordeel als je deze slimme methode gebruikt. Sterker nog, het kan je zelfs in de war brengen als je niet 100% zeker bent van je modellen."

De Conclusie in Gewone Taal

Wees voorzichtig met oude data: In een dynamische proef (zoals tijdens de coronapandemie) verandert de wereld (en de patiënten) snel. Het simpelweg samenvoegen van oude en nieuwe controlegroepen kan leiden tot verkeerde conclusies.
Focus op het juiste moment: Vergelijk altijd de nieuwe behandeling met de mensen die op datzelfde moment in de proef zaten.
Gebruik slimme statistiek: In plaats van meer data te verzamelen (door oude controles toe te voegen), gebruik je betere statistische technieken (covariaat-gecorrigeerde dubbel robuuste schatters) om de bestaande data zo goed mogelijk te benutten.

Kortom: Het is beter om een klein, scherp en eerlijk oordeel te hebben van de juiste mensen, dan een groot, wazig oordeel van iedereen die er ooit is geweest. De auteurs bewijzen dat je met de juiste statistische "bril" de beste resultaten haalt zonder de valkuil van de tijd-drift in te lopen.

Each language version is independently generated for its own context, not a direct translation.

Hier is een gedetailleerde technische samenvatting van het artikel "Causal Survival Analysis in Platform Trials with Non-Concurrent Controls" in het Nederlands.

Titel: Causale overlevingsanalyse in platformtrials met niet-tijdsgelijkgestelde controles

Auteurs: Antonio D'Alessandro, Samrachana Adhikari, en Michele Santacatterina (NYU School of Medicine)

1. Het Probleem

Platformtrials zijn adaptieve experimentele opzetten waarbij behandelingsarmen op verschillende tijdstippen kunnen worden toegevoegd of verwijderd, terwijl er één gedeelde controlegroep blijft bestaan. Dit leidt tot twee soorten controles:

Tijdsgelijkgestelde controles (Concurrent Controls): Patiënten die tegelijkertijd met de specifieke behandelingsarm in de trial zijn opgenomen en hadden kunnen worden gerandomiseerd naar die arm of de controlegroep.
Niet-tijdsgelijkgestelde controles (Non-Concurrent Controls - NCC): Patiënten die zijn opgenomen op momenten waarop de specifieke behandelingsarm nog niet beschikbaar was (of al was verwijderd) en dus een kans van nul hadden om aan die specifieke behandeling te worden toegewezen.

Hoewel het samenvoegen (poolen) van NCC met concurrente controles vaak wordt voorgesteld als een strategie om de statistische efficiëntie te verhogen (door meer data te gebruiken), zijn er drie cruciale onduidelijkheden:

Welke causale schatting (estimand) wordt hiermee eigenlijk getoetst?
Welke aannames zijn nodig om deze schatting te identificeren en te schatten, vooral bij tijd tot gebeurtenis-data (survival data)?
Wanneer levert het toevoegen van NCC daadwerkelijk een winst in precisie op, en wanneer introduceert het vertekening (bias)?

Deze problemen worden verergerd door "tijdsdrift" (temporal drift), waarbij de verdeling van baseline covariaten verandert tijdens de rekrutering, wat kan leiden tot vertekening als NCC naïef worden gepoold.

2. Methodologie

De auteurs ontwikkelen een "estimand-first" raamwerk voor causale overlevingsanalyse, geïnspireerd door de Adaptive COVID-19 Treatment Trial (ACTT).

A. Causale Definitie en Identificatie

Doelstelling: Het schatten van de concurrente behandelings-specifieke counterfactuele overlevingscurve $\theta(a, t) = P\{T(a) > t \mid V_{\tilde{a}} = 1\}$ . Dit is de overleving die zou worden waargenomen onder behandeling $a$ , specifiek voor de populatie waarin behandeling $\tilde{a}$ beschikbaar was.
Schatting: In plaats van het hazard ratio (dat vaak klinisch moeilijk interpreteerbaar is), focussen ze op het Restricted Mean Survival Time (RMST) en het verschil daartussen (dRMST).
Aannames: Ze formuleren een reeks aannames voor non-parametrische identificatie:
- Exchangeability: Randomisatie binnen de concurrente populatie.
- Consistency: De waargenomen uitkomst komt overeen met de counterfactuele uitkomst.
- Random Censoring: Censering is onafhankelijk van de uitkomst gegeven covariaten.
- Positiviteit: Elke subgroep heeft een kans om in de controlegroep te zitten.
- Assumptie A7 (Cruciaal): De hazard voor de controlegroep is hetzelfde voor concurrente en niet-concurrente controles, gegeven de covariaten ( $E, W$ ). Dit betekent dat er geen "tijdsdrift" is die niet door de covariaten wordt gevangen.

B. Schatters (Estimators)
De auteurs vergelijken twee benaderingen voor het schatten van de dRMST:

Outcome Regression (OR): Gebaseerd op parametrische hazard-modellen.
- OR_oc: Gebruikt alleen concurrente controles.
- OR_ac: Poolt concurrente en niet-concurrente controles.
Doubly Robust (DR): Combineert outcome regression met inverse probability weighting (gebaseerd op de Efficient Influence Function - EIF).
- DR_oc: Gebruikt alleen concurrente controles.
- DR_ac: Poolt alle controles.

De DR-schatters zijn ontworpen om consistent te blijven als ofwel het uitkomstmodel ofwel het censoring/propensiteitmodel correct is gespecificeerd.

3. Belangrijkste Bijdragen

Formele Identificatie: Het artikel biedt non-parametrische identificatieresultaten voor causale overlevingskrommen in platformtrials en formaliseert de exacte voorwaarden waaronder het poolen van NCC valide is (Assumptie A7).
Analyse van Efficiëntie vs. Bias:
- Voor OR-schatters: Poolen van NCC verbetert de precisie alleen als Assumptie A7 geldt en het parametrische hazard-model correct is gespecificeerd. Als het model verkeerd is, introduceert poolen vertekening.
- Voor DR-schatters: In veel realistische scenario's (waarbij de beschikbaarheid van behandeling deterministisch is in de opnametijd) levert het poolen van NCC geen efficiëntiewinst op voor de DR-schatter. De DR-schatter gebaseerd op alleen concurrente controles is even efficiënt, maar robuuster.
Praktische Richtlijnen: De auteurs concluderen dat de meest robuuste strategie is om te focussen op causale estimands voor de concurrente populatie en gebruik te maken van covariaat-gecorrigeerde DR-schatting met alleen concurrente controles. Efficiëntiewinst moet worden gezocht in betere prognostische covariaten, niet in het blind poolen van historische controles.

4. Resultaten

Simulaties:
- Bij correct gespecificeerde modellen presteren alle methoden goed, maar OR met gepoolde data heeft de laagste variantie.
- Bij modelmisspecificatie (een veelvoorkomend probleem in de praktijk) vertoont de OR-schatter met gepoolde data aanzienlijke vertekening en een daling in de dekking van het 95% betrouwbaarheidsinterval.
- De DR-schatter (zowel met als zonder poolen) behoudt consistentie en correcte dekking, zelfs bij modelmisspecificatie.
- Wanneer de beschikbaarheid van de behandeling deterministisch is (bijv. behandeling komt pas in fase 2), levert het poolen van NCC voor de DR-schatter geen extra efficiëntie op.
Toepassing op ACTT-data:
- De methode werd toegepast op de Adaptive COVID-19 Treatment Trial (ACTT) om het effect van Remdesivir + Baricitinib versus Remdesivir alleen te evalueren.
- De resultaten toonden aan dat het gebruik van DR-schatters met alleen concurrente data bijna dezelfde precisie opleverde als het gebruik van alle data (DR_ac), maar zonder de risico's van bias.
- De grootste winst in precisie kwam voort uit covariaat-justering (bijv. ziekteernst, leeftijd), niet uit het toevoegen van niet-concurrente controles.

5. Betekenis en Conclusie

Dit artikel biedt een cruciale waarschuwing voor onderzoekers die platformtrials uitvoeren. Hoewel het idee om niet-tijdsgelijkgestelde controles te gebruiken om steekproefomvang te vergroten aantrekkelijk is, is het riskant zonder strikte aannames.

Kernboodschap: Het "poolen" van controles is geen vrijblijvende efficiëntiewinst. Het kan leiden tot vertekening als de onderliggende hazard-functies over de tijd niet stabiel zijn (Assumptie A7).
Aanbeveling: De auteurs raden aan om causale estimands voor de concurrente populatie te definiëren en deze te schatten met doubly robust methoden die uitsluitend gebruikmaken van concurrente controles. Dit garandeert geldige inferentie en vermijdt de valkuilen van tijdsdrift, terwijl efficiëntie kan worden verbeterd door het opnemen van sterke prognostische covariaten in het model.

Deze aanpak sluit naadloos aan bij de FDA en ICH E9(R1) richtlijnen die een "estimand-first" benadering eisen, waarbij de wetenschappelijke vraag leidend is in plaats van het model.

Causal Survival Analysis in Platform Trials with Non-Concurrent Controls

Het Probleem: De "Niet-Tijdige" Juryleden

Wat doet dit papier?

De Twee Manieren om te Rekenen

De Oplossing: De "Dubbel Robuuste" Chef-kok

De Conclusie in Gewone Taal

Titel: Causale overlevingsanalyse in platformtrials met niet-tijdsgelijkgestelde controles

1. Het Probleem

2. Methodologie

3. Belangrijkste Bijdragen

4. Resultaten

5. Betekenis en Conclusie

Meer zoals dit

Efficient semiparametric estimation of marginal treatment effects with genetic instrumental variables

Functional Bias and Tangent-Space Geometry in Variational Inference

Shape-constrained density estimation with Wasserstein projection

Estimation of heterogeneous principal effects under principal ignorability

Uncertainty quantification for critical energy systems during compound extremes via BMW-GAM