Empirical Asset Pricing via Ensemble Gaussian Process Regression

이 논문은 주식 및 거시경제 정보를 기반으로 조건부 기대 수익률을 예측하기 위해 가우시안 프로세스 회귀 (GPR) 기반 앙상블 학습 방법을 제안하며, 1962 년부터 2016 년까지의 미국 주식 데이터를 통해 기존 머신러닝 모델보다 통계적·경제적 성능이 우수하고 불확실성을 고려한 최적 포트폴리오 구성이 가능함을 입증했습니다.

Damir Filipovic, Puneet Pasricha

게시일 Tue, 10 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 문제: "너무 많은 학생을 한 번에 가르치는 것은 불가능하다"

주식 시장은 매일 수만 개의 주식과 수많은 경제 지표가 얽혀 있어 매우 복잡합니다. 기존에 쓰이던 최신 인공지능 (신경망) 모델들은 이 방대한 데이터를 한 번에 학습하려고 합니다.

  • 비유: 마치 수만 명의 학생을 한 교실에 모아놓고, 한 명의 선생님 (모델) 이 모든 것을 동시에 가르치려 하는 상황입니다.
    • 문제점 1: 교실이 너무 커서 (데이터가 너무 많아서) 선생님이 모든 학생의 특징을 파악하는 데 시간이 너무 오래 걸리고, 컴퓨터가 과부하가 걸립니다.
    • 문제점 2: 선생님이 "정답"만 알려줄 뿐, "내가 이 답을 얼마나 확신하는지"는 알려주지 않습니다. "이 학생이 시험에 떨어질 확률이 90% 일 수도 있는데, 그냥 점수만 알려주는 것"과 같습니다.

2. 해결책: "전문가 팀 (Ensemble) 과 그들의 '확신도'"

저자들은 이 문제를 해결하기 위해 **가우시안 프로세스 회귀 (GPR)**라는 방법을 사용하되, 이를 팀워크 (Ensemble Learning) 방식으로 바꿨습니다.

  • 비유 1: "전문가 팀을 꾸리는 것"

    • 수만 명의 학생을 한 번에 가르치지 않고, 작은 그룹 (월별 데이터) 으로 나누어 각각의 전문 교사 (모델) 를 배치합니다.
    • 각 교사는 자신의 그룹만 집중적으로 가르칩니다. 이렇게 하면 컴퓨터 계산 속도가 훨씬 빨라지고, 새로운 데이터가 들어와도 기존 교사는 그대로 두고 새로운 교사를 추가하기만 하면 됩니다 (온라인 학습).
    • 최종 답안은 이 모든 교사의 의견을 **가중치 (Weight)**를 두어 합칩니다. 최근 시장 상황과 비슷한 경험을 가진 교사의 의견을 더 많이 반영하는 식입니다.
  • 비유 2: "예측의 '불확실성'을 함께 알려주는 나침반"

    • 기존 AI 는 "내일 주가가 100 원 오를 것이다"라고 점수만 알려줍니다.
    • 하지만 이 새로운 모델은 **"100 원 오를 것 같지만, 내 예측의 불확실성은 높아요 (나침반이 흔들림)"**라고 함께 알려줍니다.
    • 핵심: 투자자는 이 '불확실성' 정보를 활용합니다. "예측은 좋지만 불확실성이 너무 높은 주식은 피하고, 예측도 좋고 불확실성이 낮은 주식에 투자"하는 것입니다.

3. 결과: "더 안전하고 더 수익이 나는 포트폴리오"

이 방법을 실제 미국 주식 시장 (1962~2016 년) 에 적용해 본 결과, 놀라운 성과가 나왔습니다.

  • 통계적 성과: 기존 AI 모델들보다 주가 예측 정확도 (R-squared) 가 훨씬 높았습니다.
  • 경제적 성과 (투자 수익):
    • 불확실성 회피형 포트폴리오: "예측이 확실한 주식"에 집중하는 전략을 썼을 때, 기존 방식보다 리스크는 줄이고 수익은 훨씬 크게 얻었습니다.
    • 샤프 비율 (위험 대비 수익률): 이 모델로 만든 포트폴리오의 수익률은 S&P 500 지수나 기존 방식보다 월등히 높았습니다. 특히, "예측이 확실한 주식"을 고르는 데 성공했습니다.

4. 어떤 정보가 가장 중요했을까?

모델이 가장 잘 활용한 정보들은 다음과 같습니다.

  • 최근 가격 흐름: 주가가 단기간에 급등했다가 떨어지는 현상, 혹은 장기적인 상승 추세 등.
  • 유동성 (거래 편의성): 거래가 잘 안 되는 주식 (매수/매도 차액이 큰 주식) 일수록 예측 수익률이 높게 나왔습니다. (위험이 큰 만큼 보상도 크다는 뜻)

📝 한 줄 요약

이 논문은 **"수만 개의 주식을 한 번에 분석하는 거대한 AI 대신, 작은 그룹별로 전문성을 가진 교사 팀을 꾸려서, '예측의 정확도'와 '불확실성'을 함께 고려하는 새로운 투자 전략을 만들었다"**는 것입니다.

이 방법은 컴퓨터 계산 속도를 빠르게 만들었을 뿐만 아니라, **"내가 이 투자에 얼마나 확신할 수 있는지"**를 알려주어 투자자가 더 현명하게 자산을 배분할 수 있게 도와주었습니다. 마치 안개가 낀 길에서 단순히 "앞으로 가라"고 말하는 대신, **"앞으로 가되, 오른쪽으로 갈 확률이 높고 왼쪽은 위험하니 조심하라"**고 알려주는 것과 같습니다.