Forecast collapse of transformer-based models under squared loss in financial time series

이 논문은 금융 시계열 데이터의 약한 조건부 구조 하에서 Transformer 기반 모델이 최적 예측값 주변에 노이즈를 재사용하여 분산을 증가시키고 편향은 줄이지 못함으로써 예측 성능이 저하된다는 이론적 메커니즘을 제시하고, 고빈도 EUR/USD 환율 데이터를 통해 단순 선형 벤치마크보다 Transformer 모델의 예측 오차가 더 크다는 것을 실험적으로 입증했습니다.

Pierre Andreoletti (IDP)

게시일 2026-04-02
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

📉 핵심 메시지: "복잡한 머리가 오히려 방해가 된다"

1. 상황 설정: "예측 가능한 날씨" vs "예측 불가능한 주사위"

이 논문의 핵심은 데이터의 성질에 따라 AI 의 역할이 완전히 달라진다는 점입니다.

  • 성공하는 경우 (전력 사용량, 교통량):

    • 비유: 내일 아침 7 시에 출근길 교통량이 얼마나 될지 예측하는 상황입니다.
    • 특징: 매일 아침 7 시는 출근 시간이라 차가 많고, 주말은 적습니다. 이런 **뚜렷한 패턴 (구조)**이 있습니다.
    • AI 의 역할: AI 는 과거 데이터를 보고 "아, 월요일 아침 7 시엔 항상 막히네"라고 학습합니다. 복잡한 AI 일수록 이 패턴을 더 정교하게 찾아내서 예측이 정확해집니다.
  • 실패하는 경우 (주식, 환율):

    • 비유: 다음 1 분 뒤 주가가 오를지 내릴지 예측하는 상황입니다.
    • 특징: 금융 시장은 **'효율적 시장 가설'**에 따라, 과거 데이터로 미래 가격을 예측하는 것은 사실상 주사위를 던지는 것과 같습니다. (오늘의 가격이 내일의 가격을 결정하지 않음)
    • 현실: 미래는 현재 가격과 거의 같거나 (가격), 변동폭은 0 (수익률) 이어야 하는 것이 수학적으로 '가장 합리적인' 예측입니다.

2. 문제의 원인: "소음 (Noise) 을 패턴으로 착각하다"

여기서부터가 이 논문의 핵심입니다.

  • 단순한 모델 (선형 회귀):

    • 비유: "내일 주가는 오늘과 똑같을 거야"라고 말하는 바보 같은 친구입니다.
    • 행동: 이 친구는 데이터의 잡음 (소음) 을 무시하고, 가장 안전한 답 (오늘 가격 = 내일 가격) 을 말합니다.
    • 결과: 금융 시장의 본질 (무작위성) 을 잘 반영하므로, 실수가 적습니다.
  • 복잡한 모델 (트랜스포머/AI):

    • 비유: 모든 것을 기억하고 분석하려는 천재적인 탐정입니다.
    • 행동: 이 탐정은 과거 데이터를 보면, "아! 3 일 전 10 시 2 분에 주가가 0.01% 올랐을 때, 5 분 뒤에 0.02% 올랐어! 이 패턴이 중요해!"라고 무의미한 잡음 (소음) 을 패턴으로 착각합니다.
    • 결과: AI 는 진짜 패턴이 없는데도, 잡음까지 패턴으로 만들어서 예측합니다. 이를 **'잡음의 재사용 (Noise Reuse)'**이라고 합니다.
    • 붕괴: AI 가 예측한 값은 "오늘 가격"이라는 정답 주위에서 불필요하게 요동치기만 합니다. 예측이 0 이 아니라, 0 주변에서 무작위로 흔들리는 것입니다.

3. 결론: "더 똑똑해질수록 더 엉망이 된다"

논문은 다음과 같은 역설을 지적합니다.

"금융 시장처럼 예측할 수 없는 (잡음이 많은) 데이터에서는, 모델이 더 똑똑해질수록 (복잡해질수록) 오히려 예측 오차가 커진다."

  • 왜? 복잡한 모델은 잡음까지 학습하려 하기 때문입니다.
  • 비유: 소음이 가득한 방에서 "조용히 해"라고 외치는 것 (단순 모델) 이, "소음의 패턴을 분석해서 소음을 제거하자"라고 복잡한 장비를 가동하는 것 (복잡한 AI) 보다 더 조용한 결과를 낳는 것과 같습니다.

4. 실험 결과 (유로/달러 환율 데이터)

저자는 실제 유로/달러 환율 데이터를 가지고 실험했습니다.

  • 결과: 최신 AI 모델 (PatchTST) 은 단순한 선형 모델보다 약 1.7 배 더 큰 오차를 보였습니다.
  • 의미: AI 가 예측한 값은 단순한 "오늘 가격 유지"보다 훨씬 더 많이 흔들렸고, 그 흔들림이 오차의 원인이 되었습니다.

💡 요약 및 교훈

이 논문은 **"AI 가 무조건 좋다는 말은 아니다"**라고 경고합니다.

  1. 패턴이 있는 곳 (날씨, 교통): AI 는 천재입니다. 복잡한 구조를 찾아내서 예측을 잘합니다.
  2. 패턴이 없는 곳 (주식, 환율): AI 는 바보가 됩니다. 잡음을 패턴으로 착각해서 예측을 망칩니다.
  3. 해결책: 금융 예측을 위해 더 복잡한 AI 를 만드는 것은 시간 낭비입니다. 대신 **"무엇을 예측할지 (예: 가격 자체가 아니라 확률 분포)"**나 **"어떤 목표를 설정할지"**를 다시 생각해야 합니다.

한 줄 요약:

"주식 시장은 주사위 게임인데, AI 는 그 주사위 굴러가는 소리를 분석해서 '내일은 6 이 나올 거야'라고 너무 열심히 예측하다가, 단순한 '오늘과 똑같을 거야'라는 말보다 더 엉뚱한 답을 내놓고 있습니다."