Estimands and the Choice of Non-Inferiority Margin under ICH E9(R1)

Dieser Artikel untersucht, wie die Wahl des Nicht-Unterlegenheitsrandes in klinischen Studien gemäß ICH E9(R1) von der spezifischen Schätzielgröße (Estimand) abhängt, und verdeutlicht anhand von Simulationen und Beispielen, dass historische Behandlungseffekte und die Konstantannahme nur im Kontext der gewählten Schätzielgröße korrekt interpretiert und für die Randbestimmung herangezogen werden können.

Tobias Mütze, Helle Lynggaard, Sunita Rehal, Oliver N. Keene, Marian Mitroiu, David Wright

Veröffentlicht Thu, 12 Ma
📖 5 Min. Lesezeit🧠 Tiefgang

Each language version is independently generated for its own context, not a direct translation.

🍎 Der große Abnehm-Wettbewerb: Warum die Messlatte genau eingestellt werden muss

Stellen Sie sich vor, Sie wollen einen neuen, besseren Abnehm-Tee entwickeln. Sie wissen, dass es bereits einen sehr erfolgreichen Tee gibt (nennen wir ihn „Semaglutid-Tee"). Ihr Ziel ist es nicht, den alten Tee zu schlagen (das wäre ein „Überlegenheits-Test"), sondern nur zu beweisen, dass Ihr neuer Tee mindestens genauso gut ist wie der alte. Das nennt man einen „Non-Inferiority"-Test (Nicht-Unterlegenheits-Test).

Aber wie stellen Sie sicher, dass Ihr neuer Tee wirklich gut ist? Sie müssen eine Messlatte ziehen. Wenn Ihr Tee nur 1 % schlechter ist als der alte, ist das okay? Oder muss er 10 % schlechter sein, damit man sagt: „Nein, das ist zu viel Unterschied"?

Dieser Artikel dreht sich genau um diese Frage: Wie hoch darf diese Messlatte (der „Nicht-Unterlegenheits-Margin") eigentlich sein?

1. Das Problem: Die Messlatte hängt von der Frage ab

Früher dachte man: „Die Messlatte ist fest." Aber die Autoren sagen: Nein, die Messlatte hängt davon ab, was genau Sie messen wollen.

Stellen Sie sich vor, Sie messen den Erfolg eines Abnehm-Programms.

  • Szenario A (Die „Was-wäre-wenn"-Frage): Wir messen nur, wie viel Gewicht die Leute verlieren, wenn sie den Tee bis zum Ende trinken und nichts anderes tun. (Das nennt man im Artikel „hypothetische Strategie").
  • Szenario B (Die „Realitäts"-Frage): Wir messen, wie viel Gewicht die Leute verlieren, auch wenn sie den Tee abbrechen oder zwischendurch noch andere Pillen nehmen. (Das nennt man „Behandlungs-Politik-Strategie").

Die Analogie:
Stellen Sie sich vor, Sie testen ein neues Auto.

  • Im Szenario A messen Sie nur die Höchstgeschwindigkeit auf einer perfekten Rennstrecke ohne Stau.
  • Im Szenario B messen Sie die Durchschnittsgeschwindigkeit im echten Berufsverkehr, inklusive Staus und roten Ampeln.

Der Unterschied zwischen den beiden Geschwindigkeiten ist riesig! Wenn Sie nun einen neuen Motor testen wollen, müssen Sie wissen: Wollen wir wissen, ob er auf der Rennstrecke mithält (Szenario A) oder ob er im Stau mithält (Szenario B)? Die „Messlatte" für den neuen Motor muss sich daran orientieren, welche Frage wir stellen.

2. Der historische Rückblick: Alte Daten sind oft unklar

Um die Messlatte für Ihren neuen Tee zu bestimmen, schauen Sie sich an, wie gut der alte Tee in der Vergangenheit funktioniert hat. Hier liegt das Problem:

  • Bei neuen Studien (wie den STEP-Studien): Die Forscher haben genau festgelegt, wie sie mit „Störungen" umgehen (z. B. wenn jemand den Tee absetzt). Sie haben zwei verschiedene Messergebnisse: eines für die „perfekte Welt" und eines für die „echte Welt".
  • Bei alten Studien (wie den SCALE-Studien): Diese wurden vor der neuen Regel (ICH E9(R1)) gemacht. Die Forscher haben oft nicht genau geschrieben, ob sie die „perfekte Welt" oder die „echte Welt" gemessen haben. Es ist wie ein Kochrezept von vor 20 Jahren, bei dem steht: „Etwas Salz hinzufügen." Wie viel? Ein Messlöffel? Eine Prise?

Das Dilemma:
Wenn Sie versuchen, die alte Messlatte für Ihren neuen Test zu berechnen, aber die alten Daten unklar sind, landen Sie in einer Grauzone.

  • Nehmen wir den alten „perfekten" Wert: Dann ist die Messlatte sehr hoch (der neue Tee muss fast genauso gut sein wie der alte in der perfekten Welt). Das ist sehr schwer zu erreichen.
  • Nehmen wir den alten „echten" Wert: Dann ist die Messlatte niedriger (der neue Tee darf etwas schlechter sein, weil er auch Staus mitmacht). Das ist leichter zu erreichen.

Der Artikel zeigt: Wenn Sie die falsche Messlatte wählen, weil Sie die alte Studie falsch interpretiert haben, können Sie entweder einen schlechten Tee durchwinken (zu niedrige Latte) oder einen guten Tee ablehnen (zu hohe Latte).

3. Die Lösung: Genau hinsehen und gemeinsam entscheiden

Die Autoren schlagen vor, dass wir nicht einfach blind auf alte Zahlen schauen dürfen. Wir müssen wie Detektive arbeiten:

  1. Die Frage klären: Was wollen wir eigentlich messen? (Die „perfekte Welt" oder die „echte Welt"?)
  2. Die alten Daten prüfen: Können wir aus den alten Studien herausfinden, was sie eigentlich gemessen haben? Oft müssen wir Annahmen treffen („Wir gehen davon aus, dass sie die echte Welt gemessen haben, weil...").
  3. Vorsicht bei Annahmen: Wenn wir Annahmen treffen müssen, müssen wir diese offenlegen. Es ist wie beim Bauen eines Hauses: Wenn Sie nicht genau wissen, wie fest der Boden ist, müssen Sie vorsichtig sein und vielleicht ein Fundament bauen, das für beide Fälle reicht.

4. Die wichtigsten Erkenntnisse in Kürze

  • Keine Einheitsgröße: Es gibt nicht die eine richtige Messlatte für alle Abnehm-Studien. Die Latte ändert sich je nachdem, wie man mit Unterbrechungen (z. B. wenn Patienten die Studie abbrechen) umgeht.
  • Vergangenheit ist unklar: Viele alte Studien haben diese Feinheiten nicht dokumentiert. Das macht es schwierig, die richtige Messlatte für neue Studien zu finden.
  • Transparenz ist alles: Forscher und Behörden (wie die EMA oder FDA) müssen genau besprechen: „Wir nehmen diese Messlatte, weil wir annehmen, dass die alten Studien so und so gemessen haben."
  • Kein „Sicherheits-Schuss": Man sollte nicht einfach immer die „konservativste" (strengste) Messlatte wählen, nur um auf Nummer sicher zu gehen. Das könnte dazu führen, dass gute neue Medikamente abgelehnt werden, weil die Messlatte zu hoch gesetzt wurde.

Fazit

Dieser Artikel ist im Grunde eine Warnung und eine Anleitung: Seien Sie nicht blind bei der Suche nach Vergleichen.

Wenn Sie einen neuen Abnehm-Tee testen wollen, müssen Sie genau wissen, was Sie messen. Und wenn Sie auf alte Daten zurückgreifen, um zu wissen, wie gut der alte Tee war, müssen Sie genau prüfen, unter welchen Bedingungen diese Daten entstanden sind. Nur so können Sie eine faire Messlatte ziehen, die sicherstellt, dass nur wirklich gute neue Medikamente auf den Markt kommen.

Kurz gesagt: Die Messlatte ist kein festes Lineal, sondern ein verstellbares Lineal, das Sie je nach Fragestellung neu einstellen müssen. Und wenn Sie alte Messungen nutzen, müssen Sie genau wissen, wie die alten Leute ihr Lineal eingestellt haben.