TradeFM: A Generative Foundation Model for Trade-flow and Market Microstructure

이 논문은 9,000 개 이상의 주식에서 수십 억 건의 거래 데이터를 학습하여 자산별 보정이 필요 없는 범용 토큰화 방식을 도입하고, 기존 베이스라인보다 우수한 성능으로 시장 미시구조의 핵심 특징을 재현하며 제로샷 일반화 능력을 입증한 새로운 생성형 기초 모델 'TradeFM'을 제시합니다.

Maxime Kawawa-Beaudan, Srijan Sood, Kassiani Papasotiriou, Daniel Borrajo, Manuela Veloso

게시일 2026-03-02
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

📈 트레이드 FM (TradeFM): 주식 시장의 '예측 천재'를 만든 AI

이 논문은 J.P. Morgan AI 연구소에서 발표한 흥미로운 연구입니다. 핵심은 **"수십억 개의 주식 거래 데이터를 학습한 AI 가, 마치 시장의 숨결을 읽듯 다음 거래를 예측하고 시뮬레이션할 수 있다"**는 것입니다.

이 복잡한 내용을 일상적인 비유로 쉽게 설명해 드릴게요.


1. 이 AI 는 무엇인가요? (TradeFM)

상상해 보세요. 수만 개의 다른 나라와 도시에서 벌어지는 거대한 경매가 있다고 칩시다. 각 경매마다 참여하는 사람, 물건 가격, 거래 속도가 모두 다릅니다. 보통은 각 경매마다 별도의 전문가가 필요하지만, 이 TradeFM은 그 모든 경매를 한 번에 공부한 초월적인 마스터입니다.

  • 규모: 5 억 2,400 만 개의 '뇌세포' (파라미터) 를 가진 거대 AI 입니다.
  • 학습 데이터: 미국 주식 시장의 100 억 개가 넘는 거래 기록을 먹었습니다. (약 9,000 개 이상의 주식 종목을 1 년 넘게 관찰한 양입니다.)
  • 목표: 단순히 주가가 오르는지 내리는지 맞추는 게 아니라, "거래가 어떻게 일어나는지" 그 자체의 규칙을 배우는 것입니다.

2. 왜 이것이 특별한가요? (기존 방식 vs 새로운 방식)

🧩 기존 방식: "맞춤형 의류"

과거의 모델들은 각 주식마다 따로 공부했습니다. 애플 (AAPL) 을 공부하려면 애플 전용 모델을, 테슬라 (TSLA) 를 공부하려면 테슬라 전용 모델을 만들어야 했습니다. 마치 각 사람 체형에 맞춰 옷을 재단하는 것과 같습니다. 효율이 떨어지고, 새로운 주식 (예: 아직 본 적 없는 주식) 이 나오면 당황합니다.

🌍 TradeFM 방식: "유니버설 사이즈 (Universal Fit)"

TradeFM 은 모든 주식이 기본적으로 같은 규칙을 따른다는 통찰을 이용합니다.

  • 비유: 거대한 쇼핑몰에서 모든 사람이 입는 유니폼을 디자인하는 것과 같습니다.
  • 핵심 기술: "규모 불변 (Scale-Invariant)" 특징을 사용합니다.
    • 비유하자면, 100 원짜리 동전과 100 만 원짜리 지폐의 '가격 차이'를 절대 금액이 아닌 비율로 봅니다.
    • "애플 주가가 1 달러 올랐다"와 "저가주 10 원이 올랐다"를 상대적인 변화로만 비교합니다.
    • 덕분에 어떤 주식이라도, 어떤 시장 (미국, 중국, 일본) 이라도 별도의 재학습 없이 바로 적용할 수 있습니다. (Zero-shot Generalization)

3. 어떻게 작동하나요? (토큰화 과정)

AI 는 숫자나 글자만 이해합니다. 하지만 주식 거래는 "시간, 가격, 물량, 매수/매도" 등 여러 정보가 섞여 있습니다. TradeFM 은 이를 레고 블록처럼 잘게 나누어 AI 가 이해할 수 있는 언어로 바꿉니다.

  1. 데이터 정제: "100 주를 150 달러에 매수했다"는 복잡한 정보를 AI 가 이해하는 숫자 코드로 바꿉니다.
  2. 예측: AI 는 "지금까지의 거래 흐름을 보니, 다음에 일어날 일은 이 코드일 확률이 높다"고 예측합니다.
  3. 시뮬레이션: AI 가 예측한 거래를 가상 시장 (시뮬레이터) 에 넣고 실행합니다. 그 결과가 다시 AI 에게 피드백되어, 다음 거래를 예측하는 데 쓰입니다.
    • 비유: AI 가 가상의 주식 시장을 직접 운영하며, "내가 이렇게 주문을 넣으면 가격이 어떻게 변할까?"를 수천 번 연습하는 것입니다.

4. 이 AI 가 뭘 잘하나요? (성능 검증)

연구진은 이 AI 가 만든 가상의 시장이 실제 시장과 얼마나 닮았는지 검증했습니다.

  • 실제 시장의 특징을 완벽하게 재현:
    • 갑작스러운 폭락/폭등 (Heavy Tails): 평범한 모델은 극단적인 상황을 못 예측하지만, TradeFM 은 "갑작스러운 큰 거래"가 일어날 확률을 실제처럼 잘 냅니다.
    • 변동성 군집 (Volatility Clustering): "요즘 시장이 불안해서 큰 변동이 계속 이어진다"는 현상을 잘 포착합니다.
  • 다른 지역에도 통합니다: 미국 주식으로만 배웠는데, 중국이나 일본 시장 데이터에도 적용했을 때 놀라울 정도로 잘 작동했습니다. (비유: 미국 요리만 배웠는데, 한국 음식도 맛있게 만들어내는 셰프)
  • 기존 모델보다 정확도 2~3 배: 과거의 수학적 모델 (Hawkes 과정 등) 보다 훨씬 정확한 분포를 만들어냅니다.

5. 이 기술이 우리 삶에 어떤 영향을 줄까요?

이 AI 는 단순히 주가를 맞추는 도구가 아닙니다. 더 큰 그림을 그립니다.

  1. 가상 데이터 생성 (Synthetic Data):
    • 비유: 실제 은행 거래 내역은 비밀이지만, AI 가 완전 똑같은 가짜 거래 내역을 만들어냅니다.
    • 용도: 금융 기관이 고객 정보를 공개하지 않고도 연구나 교육용 데이터를 공유할 수 있게 됩니다.
  2. 스트레스 테스트 (Stress Testing):
    • 비유: "만약 내일 갑자기 모든 사람이 한꺼번에 주식을 팔면 어떻게 될까?"라는 가상의 재난 상황을 시뮬레이션해 봅니다.
    • 용도: 금융 위기가 오기 전에 미리 대비책을 세울 수 있습니다.
  3. 자동 매매 트레이너:
    • AI 트레이더들이 이 가상 시장에서 수천 번의 실전 연습을 하고, 실제 시장에 나가기 전에 실력을 다질 수 있습니다.

📝 한 줄 요약

TradeFM은 "수만 개의 서로 다른 주식 시장을 한 번에 공부한 AI"로, 실제와 구별하기 힘든 가상의 시장을 만들어내어 금융 위기를 미리 예측하고, 더 안전한 투자를 도와주는 초고성능 시뮬레이션 엔진입니다.

이 기술은 금융 시장의 복잡함을 단순화하고, AI 가 시장의 '숨결'을 읽을 수 있게 했다는 점에서 금융 AI 의 새로운 시대를 연다고 평가받습니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →