Janus-Q: End-to-End Event-Driven Trading via Hierarchical-Gated Reward Modeling

이 논문은 뉴스 이벤트의 의미와 시장 반응을 통합한 대규모 데이터셋 구축과 다중 트레이딩 목표 간 균형을 잡는 계층적 게이트 보상 모델을 활용한 강화학습을 통해, 기존 시장 지수 및 LLM 기반 전략보다 우수한 수익률과 예측 정확도를 달성하는 종단간 이벤트 기반 트레이딩 프레임워크 'Janus-Q'를 제안합니다.

Xiang Li, Zikai Wei, Yiyan Qi, Wanyun Zhou, Xiang Liu, Penglei Sun, Jian Guo, Yongqi Zhang, Xiaowen Chu

게시일 2026-03-02
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

자너스-Q (Janus-Q): 뉴스 한 줄로 주가를 예측하는 '스마트 트레이더' 이야기

이 논문은 **"뉴스를 읽고 바로 매매를 결정하는 AI 트레이더"**를 소개합니다. 기존에 주가 예측이 주로 과거의 숫자 (주가, 거래량) 를 보며 미래를 점치는 방식이었다면, 이 연구는 "뉴스라는 이야기 (이벤트) 를 이해하고, 그 영향력을 계산하여 매매하는" 새로운 방식을 제안합니다.

이 복잡한 내용을 일상적인 비유로 쉽게 설명해 드릴게요.


1. 기존 방식의 문제점: "날씨 예보만 믿고 우산을 사지 않는 사람"

기존의 금융 AI 들은 마치 과거 10 년간의 기온 데이터만 보고 내일 비가 올지 예측하는 사람과 같습니다.

  • 문제: 갑자기 화산이 폭발하거나, 대통령이 취임하면 기온 데이터만으로는 예측이 안 됩니다.
  • 현실: 주식 시장도 마찬가지입니다. "어떤 회사가 M&A(인수합병) 를 한다", "실적이 폭락했다" 같은 단순한 뉴스 (이벤트) 하나가 주가를 순식간에 뒤흔듭니다.
  • 기존 AI 의 한계: 기존 AI 는 이 뉴스들을 '보조 자료'로만 쓰거나, 숫자 패턴에 맞춰서 해석하려다 보니, 뉴스의 진짜 의미를 놓치고 잘못된 매매를 하곤 했습니다.

2. 자너스-Q 의 등장: "뉴스의 의미를 읽는 현명한 투자자"

이 연구팀이 만든 **자너스-Q (Janus-Q)**는 완전히 다른 접근을 합니다.

  • 핵심 아이디어: "뉴스를 숫자로만 보지 말고, 이벤트 (사건) 그 자체로 파악하자."
  • 비유: 자너스-Q 는 마치 유능한 증권 애널리스트처럼 행동합니다.
    1. 뉴스가 나오면 "아, 이건 '리스크 경고' 사건이구나!"라고 분류합니다. (이벤트 분류)
    2. "이런 사건이 과거에 발생했을 때 주가가 얼마나 떨어졌지?"라고 과거 데이터를 떠올립니다. (역사적 통계)
    3. "이번 뉴스는 정말 충격적이니 주가가 5% 는 떨어지겠군!"라고 예측합니다. (영향력 예측)
    4. "그럼 지금 바로 팔아야지!"라고 결정을 내립니다. (매매 실행)

3. 자너스-Q 가 어떻게 배우는가? (두 단계 학습)

이 AI 는 두 단계의 훈련을 통해 전문가가 됩니다.

1 단계: 방대한 뉴스 도서관 만들기 (데이터 구축)

  • 상황: AI 가 배울 수 있는 '정답이 있는 뉴스'가 없었습니다.
  • 해결: 연구팀은 6 만 2 천 개의 뉴스를 전문가들이 직접 분석했습니다.
    • "이 뉴스는 어떤 사건인가?" (예: 인수합병, 리스크 경고)
    • "어떤 주식에 영향을 줬는가?"
    • "실제로 주가가 얼마나 움직였는가?" (이걸 CAR이라고 부르는데, 쉽게 말해 "뉴스 때문에 발생한 순수한 수익/손실"입니다.)
  • 비유: 마치 수천 권의 사례집을 만들어, "A 사건이 발생하면 B 주식이 C% 떨어졌다"는 식의 정답을 AI 에게 주입한 것입니다.

2 단계: 실전 훈련과 보상 시스템 (모델 학습)

  • 상황: AI 가 단순히 "떨어질 것 같다"고 말하는 것만으로는 부족합니다. 실제로 돈을 벌어야 하니까요.
  • 해결: **계층형 게이트 보상 모델 (HGRM)**이라는 독특한 시스템을 도입했습니다.
    • 비유: AI 를 훈련시키는 엄격한 코치가 있다고 상상해 보세요.
      • 1 차 문 (하드 게이트): "방향성을 틀리면 (오르는데 내렸다고 하면) 아예 점수 0!" (실수하면 즉시 제재)
      • 2 차 문 (소프트 게이트): "이벤트 종류를 잘못 맞췄다면? 점수 깎아!" (예: '실적 발표'를 '리스크 경고'로 오인하면 감점)
      • 최종 보상: 방향도 맞고, 이벤트도 잘 분석해서 실제로 돈을 벌었다면 큰 점수를 줍니다.
    • 이 과정을 통해 AI 는 "무조건 많이 매매하는 것"보다 **"올바른 논리로 올바른 타이밍에 매매하는 것"**을 배우게 됩니다.

4. 결과: 왜 자너스-Q 가 특별한가?

실험 결과, 자너스-Q 는 기존 방식보다 훨씬 뛰어났습니다.

  • 성과: 기존 지수 (시장 평균) 나 다른 AI 들보다 수익률 (샤프 비율) 이 100% 이상 더 높았습니다.
  • 비유: 다른 트레이더들이 "날씨 예보 (과거 데이터)"만 믿다가 비를 맞고 옷을 다 젖혔다면, 자너스-Q 는 "화산 폭발 뉴스 (이벤트)"를 보고 미리 우산을 챙겨서 비를 피하고 오히려 돈을 벌었습니다.
  • 특징: 단순히 확률로 맞추는 게 아니라, **"왜 주가가 움직였는지"에 대한 논리적 설명 (추론)**도 함께 제공하므로, 인간 투자자도 그 이유를 이해할 수 있습니다.

5. 요약: 한 줄로 정리하면?

"자너스-Q 는 과거의 숫자 패턴에 매몰되지 않고, 뉴스 속 '사건 (이벤트)'의 의미를 깊이 있게 이해하고, 과거의 실제 반응 데이터를 바탕으로 가장 합리적인 매매 결정을 내리는 차세대 금융 AI 입니다."

이 기술은 금융 시장이 단순히 숫자의 흐름이 아니라, 사람들의 이야기 (뉴스) 와 사건들이 만들어내는 결과임을 다시 한번 일깨워주며, 더 투명하고 수익성 높은 투자를 가능하게 합니다.