Either a Confidence Interval Covers, or It Doesn't (Or Does It?): A Model-Based View of Ex-Post Coverage Probability

이 논문은 네이만의 전통적인 빈도주의적 해석인 "신뢰구간이 모수를 포함하든 포함하지 않든"이라는 이분법적 관점을 비판하며, 동일한 확률 모델의 다른 조건부 수준으로 해석될 수 있는 설계 단계의 피복 확률과 단일 사례의 조건부 확률 간의 긴장 관계를 지적하고, 신뢰를 예측 확률로 재해석하는 대안적 관점을 제시합니다.

Scott Lee

게시일 2026-03-06
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 통계학에서 가장 유명한 오해 중 하나인 **"신뢰구간 (Confidence Interval) 은 계산된 후에는 '_covering(포함)'인지 '아닌지' 둘 중 하나일 뿐, 확률로 말할 수 없다"**는 주장을 반박하는 내용입니다.

저자 스콧 리 (Scott Lee) 는 이 "둘 중 하나 (Either-Or)"라는 생각이 너무 엄격해서, 우리가 실제로 데이터를 분석할 때 겪는 현실적인 문제들을 무시한다고 말합니다.

이 복잡한 논리를 일상적인 비유와 쉬운 한국어로 설명해 드리겠습니다.


🍫 핵심 비유: "초콜릿 공장"과 "미지의 맛"

이 논문을 이해하기 위해 저자가 사용한 '초콜릿 공장' 이야기를 먼저 상상해 보세요.

  1. 상황: 공장에서 초콜릿을 만듭니다. 기계가 90% 확률로 잘 채워진 초콜릿을 만들고, 10% 확률로 속이 비어있는 초콜릿을 만듭니다.
  2. 문제: 공장에서 나온 초콜릿 한 개가 있습니다. 아직 무게를 재기 전입니다.
    • 질문: "다음에 나올 초콜릿이 잘 채워져 있을 확률은 얼마인가요?"
    • 정답 (설계 단계): 기계의 성능을 보면 **약 90%**입니다. 이것이 우리가 믿어야 할 '설계된 확률'입니다.

하지만, 만약 우리가 **"지금 이 초콜릿은 이미 채워졌거나 (100%), 비어있거나 (0%) 둘 중 하나일 뿐이다"**라고 고집한다면 어떻게 될까요?

  • 만약 이 초콜릿이 실제로 채워졌다면, 다음 초콜릿이 채워질 확률은 90.5% 가 됩니다.
  • 만약 이 초콜릿이 비어있다면, 다음 초콜릿이 채워질 확률은 90% 가 됩니다.

여기서 문제가 생깁니다. 우리는 아직 그 초콜릿이 채워졌는지 비어있는지 모릅니다. 그런데도 "이미 결정된 사실 (채워짐/비어있음) 을 기준으로 확률을 계산하라"고 하면, 우리는 아직 모르는 사실에 대해 확률을 계산할 수 없게 되어버립니다.

이것은 마치 의사가 환자를 진단할 때 다음과 같이 말해야 한다는 것과 같습니다.

"환자가 인플루엔자 검사를 받고 '양성'이 나왔습니다. 하지만 환자가 실제로 인플루엔자에 걸렸는지 여부는 이미 정해져 있습니다 (걸렸거나 안 걸렸거나). 따라서 환자가 인플루엔자에 걸렸을 확률은 0% 혹은 100% 입니다. 우리는 그 사실을 알 수 없으니, 치료 계획을 세울 때 '81% 의 확률로 걸렸다'고 말하면 안 됩니다."

이건 말이 안 되죠? 의사는 81% 라는 확률을 바탕으로 약을 처방합니다. 통계학도 마찬가지입니다.


🎲 논문의 주요 주장 3 가지

1. "이미 일어났으니 확률은 0 이나 1 이다?" (너무 엄격한 규칙)

네이만 (통계학의 아버지) 은 원래 "신뢰구간은 장기적으로 95% 의 확률로 참을 포함한다"고 했습니다. 하지만 한 번 구해진 구간을 보고 "이건 참이거나 거짓이거나 둘 중 하나지, 확률 95% 라는 말은 틀렸다"고 주장하는 사람들이 많습니다.

저자는 **"그건 너무 엄격한 규칙이다"**라고 말합니다.

  • 비유: 주사위를 던져서 6 이 나왔습니다. "6 이 나왔으니 6 이 나올 확률은 100% 지, 1/6 이 아니다!"라고 외치는 것과 같습니다. 맞습니다. 결과는 100% 입니다. 하지만 우리는 결과를 알기 전에, 혹은 결과를 모를 때는 여전히 1/6이라는 확률을 이야기할 수 있어야 합니다.

2. "우리는 '예측'을 하고 있는 것이다"

신뢰구간을 계산할 때 우리는 미래의 예측을 하고 있습니다. "이 데이터를 바탕으로 만든 구간이 진짜 값을 포함할 확률은 얼마나 될까?"라고 묻는 것입니다.

  • 비유: 날씨 예보관이 "내일 비 올 확률 70%"라고 할 때, 내일 밤이 되어 비가 오면 "이미 비가 왔으니 확률은 100% 지, 70% 가 아니야!"라고 따지는 것은 어리석습니다. 우리는 예보 당시의 정보를 바탕으로 판단해야 합니다.
  • 저자는 신뢰구간도 마찬가지라고 말합니다. 우리가 가진 정보 (데이터) 를 바탕으로 "이 구간이 성공할 확률"을 이야기하는 것은 **예측 확률 (Predictive Probability)**로서 매우 합리적입니다.

3. "정보의 수준을 바꿔라"

통계 모델에는 두 가지 수준의 정보가 있습니다.

  1. 설계 단계 (Design Level): 데이터를 아직 보지 않았을 때의 확률 (예: 95% 신뢰구간).
  2. 완벽한 정보 (Full Information): 모든 사실을 다 안 상태 (예: 구간이 실제로 참인지 거짓인지).

저자는 우리가 완벽한 정보 (결과) 를 알지 못할 때는, 설계 단계의 확률을 사용하는 것이 합리적이라고 말합니다. 결과를 알지 못하는 상태에서 결과를 알았다고 가정하고 확률을 0 이나 1 로 고정시키는 것은, 우리가 가진 정보보다 더 많은 것을 안다고 착각하는 것입니다.


💡 결론: "신뢰 (Confidence)"란 무엇인가?

이 논문의 결론은 매우 간단하고 실용적입니다.

"신뢰구간을 계산한 후에도, 우리는 여전히 '이 구간이 참일 확률이 95% 에 가깝다'라고 말할 수 있다."

단, 이때의 '확률'은 "우리가 가진 정보 (데이터) 를 바탕으로 한 예측"이라는 뜻입니다.

  • 기존 생각: "이미 구간이 만들어졌으니, 참이든 거짓이든 확률은 0 이나 1 이다. 95% 라고 말하면 안 된다." (너무 딱딱하고 비현실적)
  • 새로운 생각: "우리는 아직 참/거짓을 모른다. 우리가 가진 데이터와 모델을 바탕으로 볼 때, 이 구간이 성공할 가능성은 95% 수준이다. 이것이 '신뢰 (Confidence)'의 진정한 의미다." (현실적이고 유용함)

📝 한 줄 요약

통계학자들은 "이미 일어난 일은 확률이 0 이나 1 이다"라고 너무 엄격하게 말하며, 우리가 아직 모르는 사실에 대해 '예측 확률'로 이야기하는 것을 금지합니다. 하지만 이 논문은 **"우리가 모르는 사실을 예측할 때는, 여전히 그 확률 (예: 95%) 을 이야기해도 괜찮다"**고 주장하며, 통계적 추론을 더 현실적이고 유용하게 만들 것을 제안합니다.

즉, "알지 못하는 상태"에서는 "아직도 확률이 존재한다"고 생각해도 된다는 것입니다!