Two-stage Adaptive Design Cluster Randomised Trials

Dit artikel introduceert een tweestaps adaptief ontwerp voor clustergerandomiseerde trials dat tussentijdse analyses mogelijk maakt voor vroegtijdige stopzetting en herontwerp, waarbij gebruik wordt gemaakt van combinatietests en Pareto-optimaliteit om kosten en steekproefgrootte te optimaliseren, zoals geïllustreerd met een stapsgewijze wig-herontwerp en een heranalyse van de E-MOTIVE-trial.

Samuel I. Watson, James Martin

Gepubliceerd Mon, 09 Ma
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een gigantisch feestje organiseert in verschillende buurten van een stad. Je wilt testen of een nieuw soort muziek (de behandeling) de sfeer verbetert. In een normaal experiment zou je individuele mensen willekeurig toewijzen aan "nieuwe muziek" of "oude muziek". Maar in dit soort onderzoek, een cluster-gewijze trial, wijzen we hele buurten (groepen) toe aan één van de opties.

Het probleem? Mensen in dezelfde buurt lijken op elkaar. Als de muziek in de ene buurt goed is, vinden iedereen in die buurt het goed, niet alleen de mensen die je specifiek hebt geselecteerd. Dit maakt het lastiger om te weten of de muziek echt werkt of dat het toeval is. Om zeker te zijn, moet je vaak heel veel buurten en mensen betrekken, wat enorm duur is.

De auteurs van dit papier, Samuel en James, hebben een slimme oplossing bedacht: een twee-traps adaptief ontwerp.

Hier is hoe het werkt, vertaald naar alledaags taal:

1. De "Proefperiode" (Fase 1)

In plaats van direct te beginnen met het organiseren van het feest in 100 buurten, beginnen we klein. We kiezen bijvoorbeeld 15 buurten per optie en kijken hoe het gaat.

  • Het slimme trucje: We kijken halverwege de tijd even goed naar de data. Is de muziek al zo geweldig dat we direct kunnen stoppen en de hele stad kunnen overtuigen? Of werkt het helemaal niet en kunnen we stoppen om geld te besparen?
  • De "Koppeltest": De auteurs gebruiken een wiskundige methode (de "combination test") die ervoor zorgt dat we de statistische regels niet breken, zelfs als we halverwege beslissingen nemen. Het is alsof je twee aparte rapporten schrijft over de eerste en tweede helft van het feest, en die later combineert tot één groot verslag zonder dat je de eerlijkheid van de cijfers verliest.

2. De "Herontwerp-Optie" (Fase 2)

Dit is waar het echt creatief wordt. Als we halverwege niet stoppen, hoeven we niet vast te zitten aan het oorspronkelijke plan. We kunnen het plan aanpassen op basis van wat we hebben gezien.

  • Voorbeeld: Stel, we dachten dat de muziek in elke buurt 50 mensen nodig had om te testen. Maar halverwege zien we dat de mensen in de buurt al heel erg op elkaar lijken (ze reageren allemaal hetzelfde). Dan hoeven we misschien niet 50 mensen per buurt te testen, maar slechts 20. We kunnen dus geld besparen door minder mensen te vragen.
  • Of andersom: Als de resultaten twijfelachtig zijn, kunnen we besluiten om meer buurten toe te voegen of de duur van het feest te verlengen om zekerheid te krijgen.

3. De "Slimme Balans" (Pareto Optimaliteit)

Het moeilijkste deel is kiezen: wat is het beste plan?

  • Wil je het minst mogelijke aantal mensen in het gemiddelde geval?
  • Of wil je zeker weten dat je nooit meer dan een bepaald bedrag uitgeeft, zelfs als het mislukt?

De auteurs gebruiken een methode die ze "Pareto-optimaliteit" noemen. Stel je voor dat je een kaart tekent met alle mogelijke plannen. Sommige plannen zijn "dom": ze kosten meer geld én testen meer mensen dan een ander plan. Die gooi je weg. De plannen die overblijven, vormen de "Pareto-voorrand". Dit zijn de slimste opties waarbij je niet kunt kiezen zonder ergens anders op te offeren. Je moet dus zelf kiezen: "Ik wil het goedkoopst mogelijk in het gemiddelde geval" of "Ik wil absoluut zeker zijn dat ik niet failliet ga".

4. Twee Voorbeelden uit de Wereld

De auteurs laten zien hoe dit werkt in de praktijk:

  • Het "Stapsgewijze" Feest (Stepped-Wedge): Stel je voor dat je de nieuwe muziek eerst in één buurt speelt, dan in twee, dan in drie... tot iedereen het heeft. Halverwege kunnen ze beslissen: "Eigenlijk werkt dit beter als we het gewoon in alle buurten tegelijk doen" of "Laten we het tempo vertragen". Ze kunnen het plan dus volledig ombuigen.
  • De E-MOTIVE Studie (Echt Geval): Ze namen een bestaand, enorm groot onderzoek over geboorte-bleedingen en keken: "Wat als we dit adaptief hadden gedaan?" Het resultaat? Ze hadden kunnen stoppen met het onderzoek na 64 buurten in plaats van 80, en met veel minder patiënten, terwijl ze toch zeker waren van het resultaat. Dat scheelt enorme kosten en tijd.

Waarom is dit belangrijk?

Onderzoekers en geldgevers (zoals overheden) willen niet geld verspillen aan onderzoeken die te groot zijn, of aan onderzoeken die te klein zijn om iets te bewijzen.

  • Voor de geldgevers: Het bespaart miljoenen.
  • Voor de deelnemers: Minder mensen hoeven mee te doen als het antwoord al duidelijk is.
  • Voor de wetenschap: Het maakt onderzoeken flexibeler en slimmer, vooral bij complexe situaties waar mensen in groepen zitten.

Kortom: Dit papier geeft een handleiding voor hoe je een groot wetenschappelijk experiment kunt plannen als een "slimme reis". Je vertrekt met een routeplan, maar als je halverwege ziet dat er een snellere weg is (of dat je bestemming al bereikt is), mag je je kaart aanpassen zonder dat je de regels van de weg breekt.