Estimands and the Choice of Non-Inferiority Margin under ICH E9(R1)

Dit artikel onderzoekt hoe de keuze van de niet-inferioriteitsmarge onder ICH E9(R1) afhankelijk is van het gekozen estimand, en illustreert aan de hand van gesimuleerde patiënttrajecten in gewichtsmanagement dat historische effecten en marges specifiek zijn voor het estimand, wat complexiteit oplevert bij het vaststellen van marges wanneer historische trials een ander estimand hebben gebruikt of het estimandframework ontbrak.

Tobias Mütze, Helle Lynggaard, Sunita Rehal, Oliver N. Keene, Marian Mitroiu, David Wright

Gepubliceerd Thu, 12 Ma
📖 6 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

De Kunst van het Vaststellen van de "Niet Slechter dan"-Grens: Een Verhaal over Gewichtsverlies en Historie

Stel je voor dat je een nieuw, geweldig dieetpillen wilt uitvinden. Je wilt bewijzen dat het net zo goed werkt als de huidige marktleider (laten we die "Semaglutide" noemen). Je hoeft niet beter te zijn, je hoeft alleen maar niet slechter te zijn. Dit heet een "non-inferiority" (niet-onderleggen) studie.

Maar hier zit de klem: hoe weet je wat "niet slechter" precies betekent? Hoeveel gewichtsverlies mag je maximaal verliezen ten opzichte van de concurrent en nog steeds zeggen: "Oké, dit is goed genoeg"?

Dit artikel is een gesprek tussen statistici en artsen over hoe je die grens (de marge) eerlijk en slim vastlegt, vooral nu er nieuwe regels zijn gekomen (de ICH E9(R1) richtlijnen) die zeggen: "Je moet eerst heel precies definiëren wat je eigenlijk meet."

Hier is de uitleg, vertaald naar alledaags taal met een paar creatieve vergelijkingen.

1. Het Probleem: De "Vage" Historie

Vroeger, toen we nieuwe medicijnen testten, keken we naar oude studies om te zien hoe goed de oude medicijnen werkten. Maar die oude studies waren vaak vaag. Ze zeiden: "Onze pil werkt!" Maar ze vertelden niet precies hoe ze dat maten.

Stel je voor dat je een nieuwe auto wilt testen die net zo snel moet zijn als een Ferrari.

  • Oude manier: Je kijkt naar oude raceuitslagen. Maar in die oude races reden sommige coureurs met een volle tank, anderen met een halfvolle tank. Sommigen reden in de regen, anderen in de zon. En niemand hield precies bij of ze tussendoor een tankstop maakten.
  • Nieuwe manier (de nieuwe regels): Je moet eerst zeggen: "We testen de auto op een droge baan, met een volle tank, zonder tankstops." Als je dit niet doet, kun je de oude uitslagen niet eerlijk vergelijken.

De auteurs van dit artikel zeggen: De grens van "niet slechter" hangt af van hoe je de vraag precies stelt. Als je de vraag verandert, verandert de grens ook.

2. De "Interfererende" Gebeurtenissen (De Hinderpaal)

In een gewichtsverliesstudie zijn er dingen die gebeuren die je niet kunt controleren, zoals:

  • Een patiënt stopt met de pil omdat hij misselijk is.
  • Een patiënt begint een ander dieet of een andere pil te gebruiken.

In de oude wereld zagen we dit als "fouten" of "ontbrekende data". In de nieuwe wereld noemen we dit intercurrent events (tussenkomende gebeurtenissen).

Het artikel gebruikt een prachtig voorbeeld:

  • Strategie A (Het "Wat als"-scenario): "Wat zou het gewichtsverlies zijn geweest als niemand was gestopt en niemand een ander dieet had gebruikt?" Dit is een hypothetische vraag. Het is alsof je een race kijkt in een videospel waar je de tijd kunt terugdraaien en de fouten kunt ongedaan maken.
  • Strategie B (De "Realiteit"-strategie): "Wat is het gewichtsverlies in de echte wereld, inclusief mensen die stoppen of een ander dieet gebruiken?" Dit is een beleidsmatige vraag. Het is alsof je de race kijkt zoals hij echt plaatsvond, met alle valkuilen en omwegen.

Het grote inzicht: Als je de "hypothetische" vraag stelt, ziet de oude pil er vaak beter uit dan bij de "realiteit"-vraag. En als de oude pil er beter uitziet, moet je nieuwe pil ook beter zijn om "niet slechter" te zijn. De marge verschuift!

3. Voorbeeld 1: De STEP-studies (De Duidelijke Historie)

De auteurs kijken naar de beroemde STEP-studies met Semaglutide. Gelukkig hadden deze studies de nieuwe regels al gevolgd. Ze hadden twee vragen gesteld:

  1. Hoe werkt het in de echte wereld? (Beleidsmatig)
  2. Hoe werkt het in een ideale wereld? (Hypothetisch)

Het resultaat? De "ideale wereld" toonde een groter gewichtsverlies dan de "echte wereld".

  • Als je je nieuwe pil wilt vergelijken met de ideale wereld, moet je nieuwe pil heel dicht bij dat hoge resultaat zitten. De marge is klein (je mag weinig fouten maken).
  • Als je je nieuwe pil wilt vergelijken met de echte wereld, is de marge groter (je mag iets meer afwijken).

Conclusie: Je kunt niet zomaar één getal kiezen. Je moet eerst kiezen: "Welke wereld willen we vergelijken?"

4. Voorbeeld 2: De SCALE-studies (De Vage Historie)

Nu kijken ze naar oudere studies met Liraglutide (een ander gewichtsverliesmiddel). Deze studies zijn ouder dan de nieuwe regels. Ze zeggen niet precies welke strategie ze gebruikten.

Dit is als proberen een recept te reconstrueren uit een oude krant die zegt: "De taart was lekker," maar geen ingrediëntenlijst heeft.

  • Moeten we aannemen dat ze de taart maakten alsof er geen mensen waren weggegaan tijdens het bakken?
  • Of moeten we aannemen dat ze rekening hielden met de mensen die weggingen?

De auteurs laten zien dat je hier als onderzoeker slim moet gissen. Je moet de oude rapporten, de flowcharts en de methoden zorgvuldig lezen om te raden wat ze eigenlijk bedoelden.

  • Als je verkeerd gijst, kies je de verkeerde marge.
  • Als je te streng bent (te conservatief), maak je het onmogelijk om je nieuwe pil goed te keuren.
  • Als je te mild bent, keur je misschien een slechte pil goed.

5. De Belangrijkste Les: Transparantie is Koning

De kernboodschap van dit artikel is: Wees eerlijk en duidelijk.

  1. Definieer je vraag eerst: Wat wil je precies weten? (De ideale wereld of de echte wereld?)
  2. Kies je marge op basis daarvan: De grens van "niet slechter" moet logisch aansluiten bij die vraag.
  3. Wees transparant over de geschiedenis: Als je oude studies gebruikt, zeg dan duidelijk: "We hebben aangenomen dat deze oude studie dit bedoelde, en daarom kiezen we deze marge."
  4. Overleg met de toezichthouder: Praat met de regelgevers (zoals de EMA of FDA) voordat je de studie start. Zorg dat ze akkoord gaan met je redenering.

Samenvattend in één zin:

Het is alsof je een nieuw schip bouwt dat net zo snel moet zijn als een oud, beroemd schip; je kunt pas zeggen of het "net zo goed" is als je eerst precies hebt bepaald of je de snelheid meet in een kalme baai of in een storm, en of je rekening houdt met de passagiers die tijdens de reis overboord sprongen.

De auteurs waarschuwen: Als je dit niet goed doet, kun je medicijnen goedkeuren die eigenlijk niet werken, of juist goede medicijnen afkeuren omdat je de vergelijking verkeerd hebt opgezet. De nieuwe regels zijn er om ervoor te zorgen dat we de waarheid zien, niet alleen een willekeurig getal.