A marginalized three-part interrupted time series regression model for proportional data

Each language version is independently generated for its own context, not a direct translation.

Das große Problem: Wenn Zahlen nicht normal sind

Stell dir vor, du möchtest messen, wie gut ein Krankenhaus seine Patienten bei der Schmerzbehandlung betreut. Die Patienten geben eine Note von 0 bis 100 ab (oder als Prozentzahl von 0 bis 1).

Das Problem bei solchen Daten ist, dass sie oft krumme Verteilungen haben:

Viele Nullen: Manche Patienten sagen gar nichts oder geben 0 ab.
Viele Einsen (oder 100 %): Manche sind so zufrieden, dass sie die Maximalnote geben.
Alles dazwischen: Die meisten liegen irgendwo dazwischen.

Frühere Methoden haben versucht, diese Daten wie eine normale Glockenkurve zu behandeln (wie wenn man die Körpergröße misst). Aber das funktioniert bei Prozentzahlen mit vielen Nullen und Einsen nicht gut. Es ist, als würde man versuchen, einen Würfel mit einem Lineal zu messen – das passt einfach nicht.

Die Lösung: Ein dreiteiliges Puzzle

Die Autoren (Shangyuan Ye und sein Team) haben ein neues statistisches Werkzeug entwickelt, das sie „Marginalized Zero-One-Inflated Beta Time Series Model" nennen. Das klingt schrecklich kompliziert, ist aber eigentlich wie ein drei-teiliges Puzzle:

Teil 1 (Die Nullen): Ein kleines Modell entscheidet nur: „Ist die Antwort 0 oder nicht?"
Teil 2 (Die Einsen): Ein zweites Modell fragt: „Wenn es nicht 0 ist, ist es dann 1 (oder 100 %)?"
Teil 3 (Das Dazwischen): Ein drittes Modell schaut sich die Zahlen dazwischen an (die eigentlichen Prozentwerte).

Das Besondere an diesem neuen Werkzeug ist, dass es Zeit berücksichtigt. In einer Studie schauen wir uns Daten über Monate oder Jahre an. Wenn die Schmerznoten im Januar gut waren, sind sie im Februar wahrscheinlich auch noch gut. Das nennt man „zeitliche Abhängigkeit".

Der Kleber: Die Copula

Wie verbindet man diese drei Teile miteinander, damit sie wissen, was gestern passiert ist, um heute zu entscheiden? Hier kommt der Copula (sprich: Koppula) ins Spiel.

Stell dir die Copula als Kleber vor.

Die drei Puzzleteile (Nullen, Einsen, Werte dazwischen) sind wie einzelne Ziegelsteine.
Die Copula ist der Mörtel, der sie zusammenhält und sicherstellt, dass sie sich gegenseitig beeinflussen, wenn die Zeit vergeht.
Ohne diesen Kleber wären die Teile nur lose nebeneinander und würden die Geschichte der Daten nicht richtig erzählen.

Der echte Test: Die Schmerzmanagement-Studie

Die Autoren haben ihr neues Werkzeug auf eine echte Geschichte angewandt:

Die Situation: Ein Krankenhaus hat im Jahr 2010 ein neues Pflegekonzept eingeführt (Clinical Nurse Leader), um die Patientenversorgung zu verbessern.
Die Frage: Hat sich die Zufriedenheit der Patienten mit der Schmerzbehandlung verbessert?
Das Ergebnis:
- Die Durchschnittsnote hat sich nicht dramatisch verändert (sie war schon recht hoch).
- Aber! Die Schwankungen wurden viel kleiner.
- Die Analogie: Stell dir vor, vorher gab es mal sehr zufriedene und mal sehr unzufriedene Patienten (große Schwankungen). Nach der neuen Pflegeart waren die Patienten konstant zufrieden. Es gab weniger Extremfälle. Das ist ein großer Erfolg, auch wenn der Durchschnitt nicht explodiert ist.

Warum ist das wichtig?

Bisher gab es keine gute Methode, um genau solche Daten (Prozente mit vielen Nullen/Einsen, die über die Zeit laufen) zu analysieren. Wenn man die alten Methoden benutzt, kann man falsche Schlüsse ziehen.

Die Autoren haben gezeigt, dass ihr neues „Drei-Teile-Puzzle mit Kleber" funktioniert. Es ist besonders nützlich für:

Gesundheitspolitik (wie hier bei der Pflege).
Umfragen, bei denen viele Leute „Ja" oder „Nein" sagen.
Jede Situation, wo Daten nicht normal verteilt sind, aber über die Zeit gemessen werden.

Zusammengefasst: Sie haben ein neues, cleveres Werkzeug gebaut, um krumme, zeitliche Daten zu verstehen, und bewiesen damit, dass eine neue Pflegeart im Krankenhaus dafür gesorgt hat, dass die Patientenversorgung nicht nur „gut", sondern vor allem zuverlässig wurde.

Each language version is independently generated for its own context, not a direct translation.

1. Problemstellung und Motivation

Interrupted Time Series (ITS) Designs sind ein Standardverfahren zur Evaluierung von Gesundheitspolitiken, bei denen die zeitliche Abhängigkeit von Ergebnissen berücksichtigt wird. Häufig sind die Zielvariablen in solchen Studien prozentuale Werte oder Anteile (Proportional Data), die im Intervall $[0, 1]$ liegen.

Die Analyse solcher Daten stellt mehrere Herausforderungen dar:

Verteilungseigenschaften: Die Daten sind oft stark schief verteilt, an den Grenzen 0 und 1 gebunden und weisen eine hohe Anzahl an Nullen oder Einsen auf (Zero-One-Inflation).
Limitationen linearer Modelle: Herkömmliche lineare Regressionsmodelle sind ungeeignet, da sie Schätzwerte außerhalb des $[0, 1]$ -Intervalls produzieren können und die Normalverteilungsannahme verletzen.
Limitationen bestehender Beta-Regressionen: Zwar existieren Zero-One-inflated Beta-Modelle, um Nullen und Einsen zu modellieren, jedoch fehlt es an Modellen, die diese Inflationsstruktur mit der zeitlichen Abhängigkeit (Autokorrelation) in Zeitreihendaten kombinieren.
Interpretierbarkeit: Bei herkömmlichen Ansätzen (z. B. logistische Transformation) sind die Regressionskoeffizienten oft schwer auf der ursprünglichen Skala zu interpretieren.

2. Methodik

Die Autoren schlagen ein marginalisiertes Zero-One-inflated Beta-Zeitreihenmodell (MZOIBTS) vor, das auf Copula-Funktionen basiert.

A. Das Marginalisierte Zero-One-Inflated Beta-Modell (MZOIB)

Das Modell zerlegt die Antwortvariable $Y_t \in [0, 1]$ in drei Teile:

Nullen: Ein latenter binärer Indikator $d_{1t}$ bestimmt, ob $Y_t > 0$ .
Einsen: Ein weiterer Indikator $d_{2t}$ bestimmt, ob $Y_t = 1$ (gegeben $Y_t > 0$ ).
Werte zwischen 0 und 1: Falls $0 < Y_t < 1 $, folgt die Variable einer Beta-Verteilung mit Mittelwert$ \mu_t $und Dispersionsparameter$ \phi_t$.

Um die Regressionskoeffizienten direkt auf der marginalen (unbedingten) Erwartungswert-Skala interpretieren zu können, wird das Modell marginalisiert. Dies bedeutet, dass die Kovariablen direkt auf den marginalen Mittelwert $v_t = E(Y_t)$ wirken, anstatt auf die bedingten Parameter der latenten Prozesse.

Die Wahrscheinlichkeiten für Nullen und Einsen sowie der marginale Mittelwert werden über logistische Regressionen modelliert.
Der Dispersionsparameter $\phi_t$ wird über eine log-lineare Funktion modelliert.

B. Einbeziehung der zeitlichen Abhängigkeit via Copulas

Da es keine multivariate Erweiterung der MZOIB-Dichte gibt, nutzen die Autoren Copulas (basierend auf Sklars Theorem), um die gemeinsame Verteilung aufeinanderfolgender Beobachtungen $(Y_t, Y_{t-1})$ zu konstruieren.

Die Randverteilungen werden durch das MZOIB-Modell definiert.
Die Abhängigkeitsstruktur wird durch eine bivariate Copula-Funktion (z. B. Gauß- oder Frank-Copula) mit einem Abhängigkeitsparameter $\rho$ modelliert.
Dies ermöglicht eine flexible Modellierung der Autokorrelation, ohne die Interpretation der marginalen Regressionskoeffizienten zu beeinträchtigen.

C. Schätzverfahren und Inferenz

Aufgrund der Komplexität der Likelihood-Funktion (bedingt durch die Copula-Transformation) wird eine zweistufige Schätzmethode vorgeschlagen:

Schätzung der Randparameter: Die Parameter des marginalen Modells werden durch Maximierung der kompositen Log-Likelihood (unter der Annahme von Unabhängigkeit) geschätzt. Dies ist ein Pseudo-Maximum-Likelihood-Ansatz.
Schätzung der Standardfehler: Um die Autokorrelation zu berücksichtigen, werden zwei Methoden vorgeschlagen:
- HAC (Heteroskedasticity and Autocorrelation Consistent): Eine Korrektur der Kovarianzmatrix basierend auf Newey-West-Schätzern.
- Parametrisches Bootstrap: Eine Resampling-Methode, die auf den geschätzten Copula-Parametern basiert. Dies wird als robuster für kleine Stichproben angesehen.

Für die ITS-Analyse wird ein segmentiertes Regressionsmodell verwendet, das einen Wechselpunkt (Change Point) $\tau$ erlaubt, der nicht notwendigerweise mit dem Zeitpunkt der Intervention übereinstimmt. Dieser wird durch Minimierung eines modifizierten BIC-Kriteriums (cBIC) geschätzt.

3. Schlüsselergebnisse

A. Simulationsstudien

Die Autoren führten umfangreiche Simulationen durch, um die Leistung des Verfahrens bei endlichen Stichproben zu testen:

Typ-I-Fehler: Das Bootstrap-Verfahren liefert bei kleinen Stichprobengrößen ( $n < 300$ ) zuverlässigere Typ-I-Fehler-Raten (nahe am nominalen Niveau von 0,05) als das HAC-Verfahren, welches bei kleinen Stichproben zu stark inflatierte Fehler aufweist.
Robustheit: Das Modell ist robust gegenüber Fehlspezifikation der Copula-Familie (z. B. Daten aus einer Frank-Copula, angepasst mit einer Gauß-Copula). Die Punktschätzer der marginalen Parameter bleiben unverzerrt.
Leistung (Power): Die statistische Power steigt mit der Stichprobengröße und nimmt mit abnehmender Autokorrelation zu. Das Bootstrap-Verfahren zeigt eine höhere Power als HAC, insbesondere bei kleinen Stichproben.

B. Anwendung auf reale Daten (Patientenerfahrung)

Das Modell wurde auf Daten zur „Schmerzmanagement"-Bewertung in einem Krankenhaus angewendet (Intervention: Einführung eines Clinical Nurse Leader Modells im Juli 2010).

Wechselpunkt: Der geschätzte Effekt trat erst im Oktober 2010 auf (4 Monate nach der formalen Implementierung), was auf eine Verzögerungseffekt hindeutet.
Mittelwert: Es gab keine statistisch signifikanten Änderungen im Niveau ( $\beta_{32}$ ) oder im Trend ( $\beta_{33}$ ) der Schmerzbewertung nach der Intervention.
Varianz/Dispersion: Ein signifikantes Ergebnis war die Abnahme des Dispersionsparameters $\phi_t$ nach dem Wechselpunkt. Dies führte zu einer Verringerung der Standardabweichung der Scores von 0,143 auf 0,110.
Interpretation: Obwohl der Durchschnittswert nicht signifikant stieg, führte die Intervention zu einer stabilen Patientenerfahrung (geringere Varianz), was als positiver Effekt gewertet wird.

4. Hauptbeiträge

Neues Modell: Entwicklung des ersten marginalisierten Zero-One-inflated Beta-Zeitreihenmodells, das Copulas nutzt, um zeitliche Abhängigkeiten in proportionalen Daten mit vielen Nullen und Einsen zu modellieren.
Interpretierbarkeit: Durch die Marginalisierung können die Effekte der Kovariablen direkt auf der Skala des erwarteten Anteils (0 bis 1) interpretiert werden, was bei anderen Transformationsansätzen oft nicht möglich ist.
Inferenz-Strategie: Demonstration, dass parametrisches Bootstrap für die Schätzung von Standardfehlern in diesem Kontext kleinen Stichproben überlegen ist im Vergleich zu HAC-Schätzern.
Flexibilität: Das Modell erlaubt die Schätzung eines unbekannten Wechselpunkts, der von der Interventionszeit abweichen kann, was für realistische ITS-Studien entscheidend ist.

5. Bedeutung und Implikationen

Die Arbeit schließt eine wichtige Lücke in der statistischen Methodik für die Evaluierung von Gesundheitspolitiken. Viele ITS-Studien verwenden lineare Modelle, die für proportionale Daten mit Nullen/Einsen ungeeignet sind. Das vorgeschlagene MZOIBTS-Modell bietet eine rigorose Alternative, die:

Die Verteilungseigenschaften der Daten korrekt abbildet.
Die zeitliche Struktur der Daten berücksichtigt.
Eine direkte Interpretation der Behandlungseffekte ermöglicht.

Die Anwendung auf die Patientendaten zeigt, dass Interventionen nicht nur den Mittelwert, sondern auch die Stabilität (Varianz) von Outcomes verbessern können. Dies unterstreicht die Wichtigkeit, neben dem Mittelwert auch die Dispersion in der Bewertung von Gesundheitsinterventionen zu betrachten. Die Autoren empfehlen die Verwendung der Gauß-Copula als Standard, da sie robust gegenüber Fehlspezifikationen ist und rechnerisch effizienter als andere Familien (z. B. Clayton) ist.