Temporal Coverage Bias in Financial Panel Data: A Coverage-Aware Structuring Framework with Evidence from the Dhaka Stock Exchange

이 논문은 다라카 증권거래소 데이터를 활용하여 금융 패널 데이터 구축 시 각 종목의 상장 시점을 고려하지 않은 채 날짜를 임의 확장하면 변동성 추정과 리스크 관리에 심각한 왜곡을 초래함을 입증하고, 이를 해결하기 위한 '커버리지 인식 구조화 프레임워크'를 제안합니다.

Tashreef Muhammad

게시일 2026-03-24
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 금융 데이터를 다룰 때 우리가 흔히 저지르는, 하지만 매우 위험한 **'시간에 대한 착각'**에 대해 이야기합니다. 복잡한 통계 용어 대신, 일상적인 비유를 들어 쉽게 설명해 드리겠습니다.

🍎 핵심 비유: "아직 나오지 않은 사과를 이미 썰어서 먹은 줄 안다?"

상상해 보세요. 2012 년부터 2026 년까지의 '사과 가격'을 조사하는 연구를 한다고 칩시다. 그런데 이 사과 중 하나는 2020 년에야 농장에 처음 심어졌어요.

  • 일반적인 실수 (이 논문이 지적하는 문제): 연구자가 "2012 년부터 2026 년까지 모든 사과 데이터를 모아야지!"라고 생각해서, 2020 년에 심어진 사과에 대해서도 2012 년부터 2019 년까지의 가격을 '0 원'이나 '마지막 가격'으로 채워 넣어요.

    • 마치 2012 년에 사과가 없었는데, "없던 시절의 가격은 0 원이었어"라고 기록하는 것과 같습니다.
    • 이렇게 되면 사과가 실제로 시장에 나온 2020 년 이후의 가격 변동이, 2012 년부터의 '고요했던 0 원' 기간 때문에 매우 작고 안정적으로 보이는 착시가 일어납니다.
  • 이 논문이 제안하는 해결책 (커버리지 인식 프레임워크): "아, 이 사과는 2020 년에야 나왔구나!"라고 명확하게 기록해 두는 것입니다. 2012 년~2019 년은 '데이터 없음 (공백)'으로 처리하고, 2020 년부터의 실제 가격만 분석합니다.


📊 이 논문이 발견한 놀라운 사실

저자는 방글라데시 다카 증권거래소 (DSE) 의 486 개 종목 (주식, 펀드, 채권 등) 데이터를 분석했습니다. 그 결과는 충격적이었습니다.

  1. 위험이 숨겨집니다 (변동성 왜곡):

    • 위처럼 "아직 나오지 않은 기간"을 억지로 채워 넣으면, 주식의 가격 변동 폭 (위험도) 이 약 20% 나 줄어든 것처럼 나옵니다.
    • 비유: 폭풍우가 치는 바다 (실제 시장) 를 조사할 때, 그전에 1 년 동안은 물결이 전혀 없는 호수 (아직 상장 전) 데이터를 섞어 넣으면, 전체 바다의 파도가 "조금만 흔들리는 호수"처럼 보인다는 뜻입니다.
  2. 수치 계산이 틀어집니다 (GARCH 모델 왜곡):

    • 금융 전문가들이 사용하는 복잡한 위험 계산 공식 (GARCH) 을 돌려보면, 이 착각 때문에 위험 예측치가 26% 이상이나 낮게 나옵니다.
    • 비유: 폭풍우가 얼마나 심할지 예측하는 기상청이, "폭풍우가 오기 전 1 년 동안은 날씨가 아주 좋았다"는 가짜 데이터를 넣어서 계산하면, "아, 이번에도 날씨가 좀 흐릴 뿐이지 큰 폭풍은 아니겠네"라고 잘못 예측하는 꼴입니다.
  3. 대부분의 종목이 영향을 받습니다:

    • 조사한 53 개 종목 중 90% 이상이 이 오류의 영향을 받았습니다. 즉, 이건 드문 예외가 아니라 보편적인 문제입니다.

🛠️ 이 논문이 제안하는 해결책: "출생 증명서"를 달아주세요

이 논문은 단순히 "데이터를 조심하세요"라고 말하는 것을 넘어, 구체적인 해결책을 제시합니다.

  • 가용성 행렬 (Availability Matrix): 각 종목마다 "언제 태어났고 (상장일), 언제 죽었는지 (상장 폐지일)"를 출생 증명서처럼 명확히 기록하는 시스템을 만듭니다.
  • 데이터 구조 변경: 모든 종목을 같은 시간표에 억지로 맞추려 하지 않고, 각 종목이 실제로 존재했던 시간대만 분석에 포함시킵니다.

💡 왜 이것이 중요한가요?

이런 실수가 계속되면 어떤 일이 벌어질까요?

  • 투자자: "이 주식은 위험이 적어 보이네!"라고 생각해서 막상 투자했는데, 실제로는 위험이 훨씬 컸던 경우, 손실을 입게 됩니다. (VaR, 즉 위험 가치 계산이 과소평가됨)
  • 연구자: "이 시장이 안정적이야"라고 결론 내렸는데, 사실은 데이터 처리 방식이 잘못되어 가짜 안정성을 본 것일 수 있습니다.

📝 한 줄 요약

"주식이나 금융 상품을 분석할 때, '아직 시장에 나오지 않은 기간'을 억지로 채워 넣으면, 위험이 실제보다 훨씬 작아 보이는 착각에 빠집니다. 이 논문은 각 상품의 '출생일'을 정확히 기록해서, 실제 존재했던 시간만 분석해야 진짜 위험을 알 수 있다고 경고합니다."

이 연구는 특히 신흥 시장 (방글라데시) 에서 중요하지만, 전 세계 어떤 금융 시장에서도 데이터 처리 시 '시간의 진실성'을 지키지 않으면 같은 오류가 반복될 수 있음을 보여줍니다.