Comparative e-backtests for general risk measures

이 논문은 e-value 와 e-process 를 활용하여 의존성과 모델 오명시에도 유효한 비모수적 순차 비교 백테스팅 프레임워크를 개발하고, 이를 통해 다양한 위험 측정치에 대해 더 정보력 있는 결론을 도출하는 개선된 3-영역 접근법을 제안합니다.

Zhanyi Jiao, Qiuqi Wang, Yimiao Zhao

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 왜 새로운 방법이 필요한가요? (기존 방식의 한계)

지금까지 은행들은 "내 위험 예측 모델이 틀리지 않았나요?"라고 스스로를 점검했습니다. 이를 표준 백테스트라고 합니다.

  • 비유: 마치 "내 운전 실력이 안전운전 기준을 지켰나요?"라고 묻는 것과 같습니다.
  • 문제점: 하지만 금융 감독관 (중앙은행 등) 은 단순히 "틀리지 않았는지"만 확인하는 게 아닙니다. **"내 모델이 기준이 되는 표준 모델 (예: 다른 유명 은행의 모델) 보다 더 잘하는가?"**를 비교해야 합니다.
  • 기존 방식의 약점: 기존의 통계 방법은 데이터를 모두 모아서 한 번에 결론을 내거나, 데이터가 꼬여있을 때 (예: 금융 위기 때) 제대로 작동하지 않았습니다. 마치 "지난 1 년간의 운전 기록을 다 모아서 한 번에 점수를 매기는" 방식이라, 위기 순간에 어떤 모델이 더 잘 대처했는지 실시간으로 알기 어려웠습니다.

2. 이 논문이 제안한 해결책: 'e-값 (e-value)'과 'e-과정 (e-process)'

저자들은 **'e-값'**이라는 새로운 도구를 사용했습니다. 이를 **'증거의 화폐'**라고 상상해 보세요.

  • e-값 (증거 화폐): "내 모델이 표준 모델보다 낫다"는 가설을 믿을 때, 얼마나 많은 증거 (화폐) 를 쌓을 수 있는지 나타냅니다.
  • e-과정 (실시간 계좌): 이 화폐가 시간이 지남에 따라 어떻게 쌓이거나 사라지는지 보여주는 **'실시간 계좌'**입니다.
  • 장점:
    1. 언제나 유효 (Anytime-valid): 데이터를 하나하나 받아볼 때마다 (매일매일) 계좌를 확인해도 됩니다. "오늘은 내 모델이 이겼다, 내일은 표준 모델이 이겼다"를 실시간으로 알 수 있습니다.
    2. 모델 무관 (Model-free): "이 데이터는 정규분포를 따른다" 같은 복잡한 가정을 하지 않아도 됩니다. 데이터가 어떻게 생겼든 상관없이 작동합니다.

3. 비교 테스트의 핵심: '세 가지 구역'과 '약한 우위'

이 논문은 두 모델을 비교할 때 단순히 '이겼다/졌다'가 아니라, 3 가지 구역으로 나누어 더 정교하게 판단합니다.

  1. 초록색 구역 (Pass): 내 모델이 표준 모델보다 확실히 낫습니다. (증거 화폐가 기준선을 넘었습니다.)
  2. 빨간색 구역 (Fail): 내 모델이 표준 모델보다 확실히 못합니다.
  3. 노란색 구역 (Uncertain): 둘 다 기준선을 넘어서서, "누가 더 낫지?"라고 혼란스러운 상태입니다.

여기서 이 논문의 핵심 아이디어인 '약한 우위 (Weak Dominance)'가 등장합니다.
노란색 구역에서도 포기하지 않습니다. 두 모델의 **'증거 화폐 계좌'**를 자세히 살펴봅니다.

  • 크기 (Magnitude): 최종적으로 쌓인 화폐의 총량이 더 많은 모델이 우위입니다. (누가 더 많은 증거를 모았나?)
  • 속도 (Speed): 기준선에 더 빨리 도달한 모델이 우위입니다. (누가 더 빨리 문제를 찾아냈나?)

비유: 두 선수가 마라톤을 뛰는데, 둘 다 결승선을 넘었습니다. 누가 더 잘했는지 모르겠다면, **"누가 더 멀리 달렸는지 (크기)"**와 **"누가 더 빨리 달렸는지 (속도)"**를 비교해서 승자를 가립니다.

4. 실제 적용: 구조적 변화 (금융 위기) 에 강한 도구

금융 시장은 평온할 때와 위기 (2008 년 금융위기, 코로나 팬데믹 등) 일 때 완전히 다릅니다. 이를 **'구조적 변화'**라고 합니다.

  • 기존 방식: 위기 때 모델이 망가져도, 과거의 평균 데이터만 보고 "전체적으로 괜찮다"고 할 수 있었습니다.
  • 이 논문의 방식: 위기 순간이 오면 **계좌를 리셋 (Restart)**하고 다시 시작합니다.
    • 비유: 비행기가 난기류를 만나면, "지난 1 년 평균 비행 실력"을 잊어버리고 **"지금 이 순간의 조종 실력"**을 다시 평가하는 것입니다.
    • 효과: 2008 년 위기 때는 A 모델이, 2020 년 팬데믹 때는 B 모델이 더 잘할 수 있다는 것을 실시간으로 포착해냅니다.

5. 요약: 이 논문이 우리에게 주는 메시지

이 연구는 금융 감독관과 은행들에게 다음과 같은 도구를 줍니다.

  1. 실시간 감시: 데이터를 모아서 나중에 평가하는 게 아니라, 매일매일 모델을 감시할 수 있습니다.
  2. 공정한 비교: "내 모델이 기준 모델보다 낫다"는 것을 통계적으로 확신할 수 있게 해줍니다.
  3. 유연한 대응: 시장이 갑자기 변해도 (위기), 그 순간에 어떤 모델이 더 안전한지 바로 알아차릴 수 있습니다.
  4. 명확한 결론: "누가 이겼는지"가 애매할 때조차, '누가 더 빨리, 더 많이' 증명했는지를 통해 더 나은 결론을 내립니다.

한 줄 요약:

"이 논문은 금융 위험 예측 모델을 평가할 때, **'증거 화폐'**를 실시간으로 쌓아가며, 시장이 변할 때마다 **'계좌를 리셋'**해서 가장 안전한 모델을 찾아내는 똑똑하고 유연한 새로운 감시 시스템을 제안합니다."