Surrogate-Assisted Targeted Learning for Delayed Outcomes under Administrative Censoring

Each language version is independently generated for its own context, not a direct translation.

Titel: Hoe je een langdurig experiment redt als de resultaten te laat binnenkomen

Stel je voor dat je een groot experiment doet, bijvoorbeeld om te testen of een nieuw medicijn of een gezondheidsprogramma werkt. Je hebt een groep mensen (of dorpen) die het programma krijgen, en een controlegroep die dat niet krijgt.

Het probleem? Het echte resultaat (bijvoorbeeld: "Is de ziekte na een jaar weg?") duurt lang om te zien. Maar het experiment moet al stoppen voordat die een jaar voorbij is. Dit heet administratieve censuur: de tijd is op, maar de antwoorden zijn er nog niet voor iedereen.

Soms heb je wel een tussentijds signaal (een 'surrogaat'). Bijvoorbeeld: na 3 maanden zie je of de patiënt al een voorbode van genezing heeft. Dit signaal is voor iedereen bekend, maar het echte eindresultaat ontbreekt voor degenen die pas laat zijn gestart.

Het Dilemma
Als je nu gewoon kijkt naar de mensen waar je het eindresultaat wel hebt, maak je een grote fout:

De "Gokkers" (IPCW-methode): Je probeert de mensen die ontbreken te "gokken" door hen zwaarder te wegen. Maar als bijna niemand meer een eindresultaat heeft (bijvoorbeeld omdat ze pas op de laatste dag zijn gestart), wordt die weging zo extreem groot dat je hele berekening uit elkaar valt. Het is alsof je probeert een brug te bouwen met één steen: het werkt niet.
De "Gokkers met een Formule" (GLMM): Je maakt een strakke wiskundige formule. Als je formule net iets verkeerd is (bijvoorbeeld omdat je de tijd niet goed hebt ingeschat), is je hele antwoord onjuist.

De Oplossing: De "Surrogaat-Brug"
De auteurs van dit papier (Lin Li) hebben een slimme nieuwe manier bedacht: de Surrogaat-Assisted Targeted Learning.

Laten we het vergelijken met het bouwen van een brug over een rivier waar de brugpijlers (de eindresultaten) ontbreken aan de andere kant.

De oude manier: Je probeert te springen over het gat door te gokken hoe ver je kunt springen (gokken op de kans dat iemand een resultaat heeft). Als het gat te breed is, val je.
De nieuwe manier: Je bouwt een brug die gebruikmaakt van de tussentijdse signalen (de surrogaat).
- Je kijkt eerst naar de mensen waar je wel het eindresultaat hebt.
- Je leert hoe hun eindresultaat samenhangt met hun tussentijdse signaal.
- Vervolgens "stap je over" op de mensen waar je geen eindresultaat hebt, maar wel het tussentijdse signaal. Je gebruikt de relatie die je eerder leerde om hun eindresultaat te voorspellen.

Je hoeft dus niet te gokken op de kans dat iemand een resultaat heeft (wat onstabiel is), maar je gebruikt de informatie die je wel hebt om de gaten te vullen.

Waarom is dit slim?

Stabiel: Zelfs als bijna niemand aan het einde van het experiment een resultaat heeft, werkt deze methode nog steeds goed. De "brug" blijft staan.
Dubbel Veilig (Double Robustness): Het systeem is zo ontworpen dat het twee manieren heeft om goed te zijn. Als je voorspelling voor de tussentijdse signalen goed is, werkt het. Als je voorspelling voor de kans op een resultaat goed is, werkt het ook. Alleen als beide fout zijn, mislukt het.
Groepsgevoeligheid: Omdat veel experimenten in groepen (dorpen/scholen) gebeuren, houdt deze methode rekening met het feit dat mensen in dezelfde groep meer op elkaar lijken dan mensen in andere groepen.

De "Twee-Stappen" Magie
De auteurs ontdekten dat je niet zomaar deze brug kunt bouwen met standaard software. Er zit een klein, lastig wiskundig obstakel in (een "verborgen term").
Ze bedachten een twee-stappen proces:

Stap 1: Bouw een ruwe schatting (een ruwe brug).
Stap 2: Pas een speciale "finishing touch" toe. Deze stap corrigeert de kleine foutjes die overbleven zonder dat je de lastige wiskundige details van de verdeling van de tussentijdse signalen hoeft te kennen. Het is alsof je de brug eerst bouwt en dan pas de laatste planken legt om hem waterdicht te maken.

Conclusie
In de echte wereld (zoals bij een studie in Washington State over chlamydia) bleek deze methode veel betrouwbaarder en nauwkeuriger te zijn dan de oude methoden. De oude methoden gaven vaak een heel breed, onzeker antwoord of een fout antwoord. De nieuwe methode gaf een scherp, betrouwbaar antwoord, zelfs toen veel data ontbrak.

Kort samengevat:
Wanneer je experiment stopt voordat de echte resultaten voor iedereen binnen zijn, gebruik je niet meer gokwerk of strakke formules. Je bouwt in plaats daarvan een slimme brug via de tussentijdse signalen, en corrigeert die brug met een slimme twee-stappen techniek. Zo krijg je een betrouwbaar antwoord, zelfs als de data onvolledig is.

Each language version is independently generated for its own context, not a direct translation.

Hier is een gedetailleerde technische samenvatting van het artikel "Surrogate-Assisted Targeted Learning for Delayed Outcomes under Administrative Censoring" in het Nederlands.

Titel: Surrogate-ondersteunde gerichte leer voor vertraagde uitkomsten onder administratieve censuur

Auteur: Lin Li (Universiteit van Californië, San Diego)
Datum: Maart 2026

1. Het Probleem

Veel moderne studies, met name stapsgewijze wig-clustergerandomiseerde proeven (SW-CRT's), meten het primaire eindpunt pas na een aanzienlijke vertraging. Op het moment van analyse zijn de primaire uitkomsten voor een deel van de eenheden (clusters) nog niet waargenomen vanwege administratieve censuur (bijvoorbeeld het vastgestelde einddatum van de studie). Echter, kortetermijn-surrogaatuitkomsten ( $S$ ) zijn wel breed beschikbaar voor bijna alle eenheden.

Dit creëert een specifiek semiparametrisch schattingsprobleem:

De doelcausale functional (het gemiddelde behandelingseffect, ATE) hangt af van een eindpunt dat alleen voor een krimpende subset van eenheden wordt waargenomen.
De kans op waarneming ( $g_\Delta$ ) voor laat-overstappende clusters kan dicht bij de positiviteitsgrens (nul) komen.
Bestaande methoden falen hier:
- Inverse Probability Weighting (IPW/AIPW): Wordt extreem instabiel en vertoont hoge variantie wanneer $g_\Delta \to 0$ , omdat de gewichten ($1/g_\Delta$) explodeerden.
- Complete-case analyse (bijv. GLMM): Is zeer gevoelig voor specificatiefouten in het uitkomstmodel en negeert de informatie in de surrogaatuitkomsten.

2. Methodologie: Surrogate-Assisted TMLE (SA-TMLE)

De auteur ontwikkelt een nieuwe schatter, de Surrogate-Assisted Targeted Minimum Loss Estimator (SA-TMLE), die het probleem oplost door gebruik te maken van een "surrogaat-brug" (surrogate-bridge).

Kernidee: Surrogaat-Brug Identificatie

In plaats van de inverse waarnemingskans direct in de schatter te plaatsen, wordt het doelparameter geïdentificeerd via een geneste G-computatieformule:

Men schat de regressie van de waargenomen uitkomst op de surrogaat ( $E[Y | S, A, W, t, \Delta=1]$ ).
Men integreert deze regressie over de verdeling van de surrogaat ( $P(S | A, W, t)$ ).
Dit elimineert de noodzaak om $1/g_\Delta$ direct in de doelparameter te gebruiken, waardoor de schatter robuust blijft zelfs bij zeer lage waarnemingskansen.

Semiparametrische Theorie

Efficiënte Invloedfunctie (EIC): Onder de aanname van "Surrogaat-gemedieerde Missing At Random" (MAR), draagt het censuurmechanisme geen apart component bij aan de efficiënte invloedfunctie. Dit betekent dat het schatten van de censuurkans $g_\Delta$ niet nodig is voor efficiëntie, zolang de aanname geldt.
Cluster-niveau aggregatie: Vanwege de clustergerandomiseerde opzet en intra-cluster correlatie (ICC), moet de invloedfunctie worden opgeteld (som) binnen een cluster in plaats van gemiddeld, om geldige variantieschattingen te verkrijgen.
Het probleem met één-staps DML: Een standaard "Debiased Machine Learning" (DML) één-staps constructie laat een tweede-orde restterm ( $R_{SY}$ ) achter die het product is van de schattingsfouten van het uitkomstmodel en de voorwaardelijke surrogaatdichtheid ( $f_S$ ). Deze term wordt niet verwijderd door kruisfitting (cross-fitting) en vereist een strenge snelheidsvoorwaarde voor het schatten van $f_S$ .

De Oplossing: Twee-staps Targeting

Om de term $R_{SY}$ te elimineren zonder $f_S$ direct te hoeven schatten, introduceert de auteur een twee-staps targeting procedure:

Fase 1: Initiële schatting van de nuisance-functies (uitkomstregressie, propensities) met Super Learner.
Fase 2 (Geneste fluctuatiestap): Een extra correctiestap die de schatting van de geïntegreerde uitkomst ( $\bar{Q}_{int}$ ) aanpast zodat de empirische gemiddelde van de specifieke invloedfunctiecomponenten nul wordt. Dit "absorbeert" de tweede-orde restterm $R_{SY}$ in de efficiënte score, waardoor de schatter dubbel robuust en $\sqrt{J}$ -consistent wordt zonder directe schatting van $f_S$ .

3. Belangrijkste Bijdragen

Identificatie via Surrogaat-Brug: Een nieuwe identificatiestrategie die de instabiliteit van IPW omzeilt door de inverse waarnemingskans uit de doelparameter te verwijderen.
Semiparametrische Karakterisering: Bewijs dat onder surrogate-gemedieerde MAR het censuurmechanisme geen extra variabiliteit toevoegt aan de efficiëntiegrens, en dat cluster-gerandomiseerde data aggregatie op cluster-niveau vereist.
Oplossing voor Geneste Resttermen: Identificatie van de specifieke tweede-orde kruisproduct-term ( $R_{SY}$ ) die standaard DML faalt bij geneste functionals, en de ontwikkeling van een tweestaps-TMLE die deze term elimineert zonder de surrogaatdichtheid te hoeven schatten.
Praktische Implementatie: Een open-source R-pakket (swcrtSurrTMLE) en toepassing op een realistisch scenario (Washington State EPT trial).

4. Resultaten (Simulatie en Case Study)

De methode werd getest via Monte Carlo-simulaties en een gestructureerde illustratie met de Washington State EPT-studie.

Stabiliteit bij zware censuur: In scenario's met hoge administratieve censuur (waarbij late clusters nauwelijks uitkomsten hebben) vertoont de SA-TMLE stabiele bias en lage variantie.
- Vergelijking: IPW vertoont enorme variantie en bias door instabiele gewichten. GLMM (compleet geval) vertoont systematische bias door verkeerde modelspecificatie van tijdstrends.
Dubbele Robuustheid: De schatter blijft consistent als óf het uitkomstmodel óf de propensiteitsmodellen correct zijn gespecificeerd. Echter, in eindsteekproeven kan een verkeerd gespecificeerd uitkomstmodel nog steeds bias introduceren als de restterm groot is.
Dekking (Coverage): De SA-TMLE behoudt een redelijke dekking (rond 87-91% in simulaties met $J=30$ ), terwijl IPW en GLMM vaak falen (dekking daalt naar <10% bij zware censuur). De iets lagere dekking dan de nominale 95% wordt toegeschreven aan eindsteekproef-effecten van de nuisance-schattingen (restterm-variatie).
Case Study (EPT Trial): In een gestructureerde analyse van de EPT-studie (chlamydia preventie) leverde de SA-TMLE een nauwkeurigere schatting met een smaller betrouwbaarheidsinterval dan IPW, en zonder de modelafhankelijkheid van GLMM.

5. Betekenis en Conclusie

Dit artikel biedt een fundamentele doorbraak voor de analyse van stapsgewijze wig-trials en andere longitudinale studies met vertraagde uitkomsten en administratieve censuur.

Theoretisch: Het toont aan dat de geometrie van geneste semiparametrische functionals specifieke schatters vereist die verder gaan dan standaard één-staps debiasing. De "surrogaat-brug" biedt een nieuw perspectief op missing data dat de afhankelijkheid van positieve waarnemingskansen doorbreekt.
Praktisch: Het biedt onderzoekers een robuust instrument om effecten te schatten in situaties waar traditionele methoden (IPW) instabiel worden en complete-case analyses onbetrouwbaar zijn. Dit is cruciaal voor publieke gezondheidsonderzoek waar studies vaak worden afgesloten voordat alle uitkomsten volledig zijn waargenomen.

De methode is beschikbaar in het R-pakket swcrtSurrTMLE, wat de toepasbaarheid voor onderzoekers vergroot.

Surrogate-Assisted Targeted Learning for Delayed Outcomes under Administrative Censoring

Titel: Surrogate-ondersteunde gerichte leer voor vertraagde uitkomsten onder administratieve censuur

1. Het Probleem

2. Methodologie: Surrogate-Assisted TMLE (SA-TMLE)

Kernidee: Surrogaat-Brug Identificatie

Semiparametrische Theorie

De Oplossing: Twee-staps Targeting

3. Belangrijkste Bijdragen

4. Resultaten (Simulatie en Case Study)

5. Betekenis en Conclusie

Meer zoals dit

Efficient semiparametric estimation of marginal treatment effects with genetic instrumental variables

Functional Bias and Tangent-Space Geometry in Variational Inference

Shape-constrained density estimation with Wasserstein projection

Estimation of heterogeneous principal effects under principal ignorability

Uncertainty quantification for critical energy systems during compound extremes via BMW-GAM