Same Error, Different Function: The Optimizer as an Implicit Prior in Financial Time Series

이 논문은 금융 시계열의 미지정성 (underspecification) 환경에서 최적화 알고리즘의 선택이 모델의 함수적 특성과 의사결정 결과에 중대한 편향을 부여하므로, 단순한 예측 오차 평가가 아닌 기능적 및 의사결정 차원의 분석이 필요함을 주장합니다.

Federico Vittorio Cortesi, Giuseppe Iannone, Giulia Crippa, Tomaso Poggio, Pierfrancesco Beneventano

게시일 2026-03-04
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🍳 요리의 비유: "같은 맛, 다른 레시피"

상상해 보세요. 두 명의 셰프가 같은 재료를 가지고 같은 요리를 만들었습니다.

  • 셰프 A (SGD 옵티마이저): 아주 단순하고 깔끔한 레시피를 사용했습니다.
  • 셰프 B (Adam 옵티마이저): 아주 정교하고 복잡한 레시피를 사용했습니다.

이제 맛을 평가하는 심사위원 (테스트 데이터) 이 두 요리를 맛봤습니다. 결과는 어떨까요?
"두 요리 모두 100 점 만점에 99 점입니다. 맛의 차이를 구별할 수 없습니다."

대부분의 사람들은 "아, 두 셰프의 실력이 똑같네. 아무거나 골라도 되겠군"이라고 생각할 것입니다. 하지만 이 논문은 **"아니요! 두 요리는 완전히 다릅니다!"**라고 외칩니다.

🔍 이 논문이 발견한 3 가지 놀라운 사실

1. "점수"만 보면 속아넘어갑니다 (예측의 동등성)

금융 시장 (특히 주식 변동성) 은 소음 (노이즈) 이 너무 많은 곳입니다. 마치 안개 낀 날에 멀리 있는 산을 보는 것과 같죠.

  • 복잡한 딥러닝 모델 (신경망) 이든, 간단한 통계 모델이든, 예측 오차 (실수) 는 거의 똑같습니다.
  • 마치 두 요리가 모두 "99 점"을 받은 것처럼, 모델의 성능 지표 (NMSE) 는 서로 구별이 안 됩니다.
  • 그래서 사람들은 "어떤 모델을 써도 똑같지"라고 생각하며, 단순히 점수만 보고 모델을 선택합니다.

2. 하지만 '맛'을 내는 '방식'은 다릅니다 (함수의 분기)

이 논문은 점수 (오차) 가 같아도, 모델이 데이터를 어떻게 해석하는지를 자세히 들여다봤습니다.

  • 셰프 A (SGD): 아주 단순하고 직선적인 방식으로 맛을 냅니다. "이 재료가 많으면 맛도 비례해서 강해져"라고 생각합니다. (선형적 반응)
  • 셰프 B (Adam/Muon): 아주 복잡하고 비선형적인 방식으로 맛을 냅니다. "이 재료가 너무 많으면 오히려 맛이 떨어질 수도 있어"라고 생각하며, 극단적인 상황을 피하는 복잡한 규칙을 만듭니다. (비선형적 반응)

핵심: 점수는 같지만, 세상 (시장) 을 바라보는 눈 (논리) 이 완전히 다릅니다.

3. 이 차이가 돈에 영향을 줍니다 (실제 투자 결정)

이게 왜 중요할까요? 이 두 셰프가 만든 요리를 식당 메뉴판에 올린다고 상상해 보세요.

  • 셰프 A (단순한 모델): 맛이 안정적입니다. 재료가 조금 바뀌어도 메뉴판의 순위는 크게 변하지 않습니다. 거래 횟수 (Turnover) 가 적습니다.
  • 셰프 B (복잡한 모델): 아주 예민합니다. 재료가 아주 조금만 바뀌어도 "아, 이거 이제 1 등이다!"라고 순위가 뒤바뀝니다. 거래 횟수가 매우 많습니다.

결과:
두 모델의 예측 정확도는 똑같지만, 셰프 B 의 모델을 쓰면 거래를 너무 자주 하게 되어 수수료 (거래 비용) 가 많이 나갑니다. 결국 실제 수익률은 셰프 A 가 더 나을 수 있습니다.

💡 이 연구가 우리에게 주는 교훈

  1. 최적화기 (Optimizer) 는 단순한 도구가 아닙니다.

    • 보통 개발자들은 "Adam 이니까 그냥 쓰자"라고 생각합니다. 하지만 이 논문은 어떤 최적화기를 쓰느냐에 따라 모델이 배우는 '세계관'이 달라진다고 말합니다. 최적화기는 모델에게 "어떤 종류의 정답을 찾아라"라고 암묵적으로 지시하는 선입견 (Prior) 역할을 합니다.
  2. 점수 (Loss) 만 믿지 마세요.

    • "오차가 같으니 모델이 같다"는 생각은 위험합니다. 오차가 같아도 모델이 내리는 결정 (투자 전략) 은 완전히 다를 수 있습니다.
  3. 금융에서는 '안정성'이 '정확도'만큼 중요합니다.

    • 예측이 조금 더 정확할지라도, 그로 인해 거래가 너무 자주 일어나서 수수료가 날아가면 의미가 없습니다. 따라서 모델을 고를 때는 어떤 최적화기를 썼는지, 그 모델이 얼마나 안정적인지를 함께 봐야 합니다.

📝 한 줄 요약

"금융 예측에서 모델의 '점수'가 같다고 해서 '성격'이 같은 것은 아닙니다. 같은 실수를 범하더라도, 어떤 모델을 쓰느냐에 따라 거래 비용과 수익이 완전히 달라질 수 있으니, 모델의 '성격 (함수)'까지 꼼꼼히 확인해야 합니다."

이 논문은 금융 AI 를 개발할 때, 단순히 "어떤 모델이 더 잘 맞나?"를 묻는 것을 넘어, **"어떤 모델이 더 현명한 결정을 내리는가?"**를 고민해야 한다고 말합니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →