Covariate adjustment for hierarchical outcomes and the win ratio: how to do… — 쉬운 설명

원저자: Hazewinkel, A.-D., Gregson, J., Bartlett, J. W., Gasparyan, S. B., Wright, D., Pocock, S.

게시일 2026-03-31

📖 4 분 읽기☕ 가벼운 읽기

원저자: Hazewinkel, A.-D., Gregson, J., Bartlett, J. W., Gasparyan, S. B., Wright, D., Pocock, S.

원본 논문은 CC BY 4.0 (https://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. ⚕️ 이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기

1. 배경: "승률 (Win Ratio)"이란 무엇인가?

일반적인 임상 시험에서는 "누가 먼저 죽었나?" 혹은 "누가 더 많이 입원했나?"를 세어 비교합니다. 하지만 의학적으론 죽음이 입원보다 더 심각한 사건입니다.

이 논문에서 다루는 '승률 (Win Ratio)' 방식은 두 환자를 짝을 지어 비교하는 게임과 같습니다.

게임 규칙: 치료받은 환자 (A) 와 치료받지 않은 환자 (B) 를 한 쌍으로 만듭니다.
승패 결정:
1. 먼저 사망 여부를 봅니다. A 가 B 보다 오래 살면 A 의 '승리', B 가 더 오래 살면 A 의 '패배'.
2. 만약 두 사람 모두 사망하지 않았다면, 다음으로 입원 여부를 봅니다. A 가 B 보다 입원하지 않았거나 늦게 입원하면 A 의 '승리'.
3. 두 사람 모두 입원하지 않았거나 똑같다면 '무승부 (Tie)'.
결과: 모든 환자 쌍을 비교한 뒤, A 가 이긴 횟수 / A 가 진 횟수를 계산합니다. 이 비율이 1 보다 크면 치료법이 효과가 있다는 뜻입니다.

2. 문제점: "모든 사람을 똑같이 취급하면 안 된다"

지금까지의 방식은 모든 환자 쌍을 단순히 비교만 했습니다. 하지만 현실은 그렇지 않습니다.

상황: 80 세에 당뇨가 심한 환자 (B) 와 30 세에 건강한 환자 (A) 를 비교한다고 칩시다.
문제: 만약 B 가 A 보다 조금 더 오래 살았다면, B 의 '승리'로 기록됩니다. 하지만 이는 B 가 치료법이 더 좋았기 때문이 아니라, B 가 원래 더 약해서 A 가 더 빨리 병에 걸릴 수밖에 없었기 때문일 수 있습니다.

즉, 환자들의 초기 상태 (나이, 병의 정도 등) 를 고려하지 않으면, 치료법의 진짜 효과를 왜곡할 수 있습니다. 마치 마라톤 대회에서 "시작 지점이 다른 두 사람을 비교한다"는 것과 같습니다.

3. 해결책: "맞춤형 조정 (Covariate Adjustment)"

이 논문은 **"환자들의 초기 상태 (예: NT-proBNP 라는 혈액 수치) 를 고려해서 공정한 비교를 하자"**는 새로운 방법을 제안합니다.

🏆 비유: "공정한 마라톤 대회"

기존 방식 (조정 전): 모든 선수가 같은 출발선에 서서 달린다고 가정합니다. 하지만 어떤 선수는 이미 지쳐있고, 어떤 선수는 컨디션이 좋습니다. 결과만 보면 공평하지 않습니다.
새로운 방법 (조정 후): "이 선수는 원래 컨디션이 안 좋았으니, 그 점을 감안해서 점수를 보정하자"는 것입니다.
- 예를 들어, "초기 혈압이 높은 환자는 치료 효과를 더 잘 보일 수 있다"는 사실을 통계 모델에 넣어서, 동일한 조건을 가진 환자끼리만 비교하는 것처럼 계산합니다.

4. 이 논문이 제안한 새로운 방법: "오르다 내리다 계단 (Ordinal Regression)"

저자들은 기존의 복잡한 방법들 대신, 계단 오르기에 비유할 수 있는 새로운 통계 기법을 개발했습니다.

계단 비유:
- 계단 1 단계: 죽음 (가장 나쁜 결과)
- 계단 2 단계: 입원 (중간 결과)
- 계단 3 단계: 건강 (가장 좋은 결과)
방법: 환자의 상태를 이 계단 위에 올려놓고, "치료받은 환자가 계단을 얼마나 더 잘 올라갔는가?"를 **수학적 모델 (로지스틱 회귀)**로 계산합니다.
장점:
1. 정확도 향상: 환자의 초기 상태를 보정해주므로, 치료법의 효과를 더 정확하게 잡아냅니다. (통계적 힘 증가)
2. 해석의 용이성: "나이 10 세 차이가 나면 치료 효과가 얼마나 달라지는지"처럼, 각 변수가 결과에 미치는 영향을 숫자로 명확하게 알려줍니다.
3. 유연성: 기존 방법들은 '승률'만 계산하거나, '승률'을 계산할 수 없는 경우가 많았는데, 이 방법은 '승률'을 바로 계산하면서도 보정이 가능합니다.

5. 실제 효과: "더 적은 사람으로 더 확실한 결론"

이 논문은 실제 임상 시험 데이터 (심부전 환자 연구) 와 시뮬레이션 (가상 실험) 을 통해 검증했습니다.

결과: 환자의 초기 상태를 보정해 주었을 때, 동일한 치료 효과를 발견하기 위해 필요한 환자 수가 줄어들었습니다.
비유: 원래 100 명을 조사해야 확실한 결론을 낼 수 있었는데, 보정을 통해 85 명만 조사해도 같은 확신을 가질 수 있게 된 것입니다. 이는 시간과 비용을 아끼는 큰 장점입니다.
주의: 만약 보정할 변수 (예: 환자의 성별) 가 치료 결과와 전혀 상관없다면, 보정을 해도 효과가 변하지는 않지만, 결론을 해치지는 않습니다. (안전한 방법입니다.)

6. 결론: 왜 이것이 중요한가?

이 연구는 **"임상 시험에서 환자의 개인차를 고려하는 것은 필수적이다"**라고 말합니다.

기존의 한계: 복잡한 계단식 비교 (승률) 를 할 때, 환자의 상태를 보정하는 방법이 부족했습니다.
이 연구의 기여: **새로운 계산법 (오르다 내리다 계단 모델)**을 만들어서, 치료법의 효과를 더 공정하고 정확하게, 그리고 더 적은 비용으로 증명할 수 있게 했습니다.

한 줄 요약:

"모든 환자를 똑같이 취급하지 말고, 각자의 출발선 (초기 상태) 을 고려해서 치료법의 진짜 승리를 찾아내는 공정한 심판법을 만들었습니다. 이렇게 하면 더 적은 환자로도 더 확실한 의학적 증거를 얻을 수 있습니다."

1. 연구 배경 및 문제 제기 (Problem)

계층적 복합 결과 (Hierarchical Composite Outcomes, HCE) 의 증가: 임상 시험 (특히 심혈관 질환) 에서 사망, 입원 등 임상적 중증도가 다른 사건들을 우선순위에 따라 계층화하여 분석하는 HCE 가 널리 사용되고 있습니다. 이를 분석하는 주요 지표로 승률 (Win Ratio) 이나 승차 (Win Odds) 가 사용됩니다.
기존 분석의 한계: HCE 분석에서 공변량 (covariate) 보정은 통계적 검정력 (power) 을 높이기 위해 중요하지만, 승률 분석을 위한 체계적인 보정 방법론은 아직 미흡합니다.
기존 방법론의 부족:
- 기존 방법들 (확률 지수 모델, 무작위화 기반 추정, 역확률 가중치 등) 은 승률 (Win Ratio) 보정보다는 승차 (Win Odds) 보정에 초점을 맞추거나, 공변량의 영향력을 해석하기 어렵다는 한계가 있습니다.
- 승률은 비가역적 (non-collapsible) 성질을 가지므로, 공변량 보정 여부에 따라 추정되는 모수 (conditional vs marginal) 가 달라질 수 있어 명확한 가이드라인이 부재했습니다.

2. 방법론 (Methodology)

이 논문은 계층적 결과에 대한 공변량 보정을 위한 새로운 방법론을 제안하고 기존 방법들과 비교 평가했습니다.

A. 제안된 새로운 방법: 순서형 로지스틱 회귀 기반 보정 (Ordinal Logistic Covariate Adjustment)

핵심 아이디어: 환자 단위 데이터가 아닌, 환자 쌍 (Patient Pairs) 단위 데이터에 순서형 로지스틱 회귀 (Ordinal Logistic Regression) 를 적용합니다.
구현 과정:
1. 치료군과 대조군 환자 간 모든 가능한 쌍을 형성합니다.
2. 각 쌍의 결과 변수 ( $Y_{ij}$ ) 를 정의합니다: 치료군이 이기면 2 (Win), 무승부면 1 (Tie), 대조군이 이기면 0 (Loss).
3. 공변량 차이 ( $\Delta C = C_{treatment} - C_{control}$ ) 를 독립 변수로 사용하여 모델을 적합합니다.
4. 비례 오즈 가정 (Proportional Odds Assumption) 하에 공변량 보정된 승률, 승차, 승차 (Win Difference) 를 추정합니다.
특징: 이 방법은 조건부 추정량 (Conditional Estimand) 을 제공하며, 공변량의 예후적 영향력 (Prognostic impact) 을 오즈비 (Odds Ratio) 로 해석할 수 있습니다.

B. 비교 대상 기존 방법론

확률 지수 모델 (Probability Index Models): 로지스틱 회귀를 사용하여 승차 (Win Odds) 를 추정하지만, 승률 (Win Ratio) 을 직접 계산할 수 없다는 단점이 있습니다.
무작위화 기반 방법 (Randomization-based Method): 공변량 차이와 결과 간의 상관관계를 이용해 보정 항을 산출합니다. 주로 승차 (Win Odds) 에 적용되나, 이 논문에서 승률 보정으로 확장되었습니다.
역확률 가중치 (Inverse Probability Weighting, IPW): 성향 점수 (Propensity Score) 를 기반으로 가중치를 부여하여 보정합니다.

C. 실증 분석 및 시뮬레이션

실제 데이터 적용: EMPEROR-Preserved 임상 시험 데이터를 활용하여 심혈관 사망과 심부전 입원을 계층화한 결과에 대해 공변량 보정 (NT-proBNP 및 위험 점수 변수 포함) 을 수행했습니다.
시뮬레이션 연구:
- 시나리오 1: 두 개의 시간 - 사건 (Time-to-event) 변수 (사망, 입원) 로 구성된 계층적 결과.
- 시나리오 2: 시간 - 사건 변수와 정량적 변수 (KCCQ 점수) 가 혼합된 계층적 결과.
- 변수: 예후적 공변량 (Prognostic) 과 비예후적 공변량 (Non-prognostic) 상황, 다양한 상관관계 수준을 설정하여 10,000 회 반복 시뮬레이션을 수행했습니다.

3. 주요 결과 (Key Results)

A. 실제 데이터 (EMPEROR-Preserved) 분석 결과

공변량 보정을 적용하지 않은 승률은 1.251 이었으나, 예후적 공변량 (log NT-proBNP) 을 보정하면 1.260 으로, 모든 위험 인자를 보정하면 1.280 으로 증가했습니다.
보정 후 p-value 가 개선되어 통계적 유의성이 강화되었으며, 이는 Cox 비례위험 모델에서의 보정 효과와 유사한 패턴을 보였습니다.
제안된 순서형 모델을 통해 각 공변량의 예후적 영향력 (예: NT-proBNP 증가 시 패배 확률 증가) 을 정량화할 수 있었습니다.

B. 시뮬레이션 결과

통계적 검정력 향상: 예후적 공변량을 보정했을 때, 모든 보정 방법 (제안된 순서형 모델 포함) 에서 통계적 검정력이 크게 향상되었습니다 (약 4% 증가, 이는 표본 크기 15% 증가에 상응).
비예후적 공변량: 공변량이 결과와 무관할 경우, 보정을 하더라도 검정력 손실은 발생하지 않았습니다.
방법론 비교:
- 순서형 모델 및 확률 지수 모델: 조건부 추정량을 제공하며, 보정 후 추정치가 null 값 (1) 에서 더 멀어지는 경향을 보였습니다 (Cox 모델의 보정 효과와 유사).
- 무작위화 기반 및 IPW: 한계 추정량 (Marginal estimand) 을 제공하며, 추정치는 변하지 않고 표준오차 (SE) 가 감소하여 검정력이 향상되었습니다.
정량적 변수 보정: 정량적 결과 (예: KCCQ 점수) 의 기저선과 추종 기간 값 간 상관관계가 높을수록 보정 시 검정력 향상 폭이 컸습니다 (상관 0.75 일 때 유효 표본 크기 80~90% 증가).

4. 주요 기여 및 의의 (Contributions & Significance)

새로운 방법론 제안: 승률 (Win Ratio) 에 대한 공변량 보정을 가능하게 하는 순서형 로지스틱 회귀 기반 방법을 최초로 제안했습니다. 이는 기존에 승차 (Win Odds) 만 보정 가능했던 방법론의 한계를 극복했습니다.
해석 가능성 제공: 제안된 방법은 치료 효과뿐만 아니라 각 공변량의 예후적 영향력을 오즈비로 해석할 수 있게 하여, 임상적 통찰력을 제공합니다.
검정력 향상 입증: 계층적 결과 분석에서도 공변량 보정이 통계적 검정력을 유의미하게 높인다는 것을 실증적으로 입증했습니다. 이는 기존 시간 - 사건 분석에서의 보정 효과와 동등하거나 더 큽니다.
실무 가이드라인 제시:
- 예후적 공변량은 반드시 보정해야 하며, 비예후적 공변량은 보정해도 무해함을 확인했습니다.
- 조건부 추정량 (Conditional) 과 한계 추정량 (Marginal) 의 선택은 연구 목적에 따라 결정되어야 함을 강조했습니다.
소프트웨어 및 구현 지원: 현재 R 및 Stata 패키지의 한계를 지적하고, 제안된 방법과 무작위화 기반 방법의 R 구현 예제를 제공하여 실제 적용을 용이하게 했습니다.

5. 결론

이 논문은 계층적 복합 결과 (HCE) 를 분석할 때 공변량 보정이 통계적 효율성을 크게 높인다는 점을 명확히 했습니다. 특히, 승률 (Win Ratio) 을 보정할 수 있으면서도 공변량의 영향을 해석할 수 있는 새로운 순서형 로지스틱 회귀 방법은 임상 시험 설계 및 분석에 있어 중요한 도구로 자리 잡을 것으로 기대됩니다. 저자들은 계층적 결과를 사용하는 무작위 대조 시험 (RCT) 에서 공변량 보정과 제안된 방법의 광범위한 채택을 권장합니다.

Covariate adjustment for hierarchical outcomes and the win ratio: how to do it and is it worthwhile?