Stock Market Prediction Using Node Transformer Architecture Integrated with BERT Sentiment Analysis

이 논문은 BERT 기반 감정 분석과 노드 트랜스포머 아키텍처를 통합하여 주가 간 상관관계 및 시장 감정을 고려한 그래프 구조를 구축함으로써, 기존 ARIMA 및 LSTM 모델보다 월등히 낮은 오차율 (MAPE 0.80%) 과 높은 방향성 정확도를 달성한 주식 시장 예측 프레임워크를 제안합니다.

Mohammad Al Ridhawi, Mahtab Haj Ali, Hussein Al Osman

게시일 Mon, 09 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

📈 제목: 주식 예측의 새로운 레시피: "관계도"와 "감정"을 섞다

이 연구는 주식 가격이 오를지 내릴지 예측할 때, 기존에 쓰던 방법들 (과거 가격만 보는 것) 보다 훨씬 똑똑한 방법을 제안합니다. 마치 수천 명의 친구들이 모여 있는 파티를 상상해 보세요.

1. 기존 방법의 한계: "혼자서 외치는 소리"

기존의 주식 예측 프로그램들은 각 주식 (예: 애플, 삼성) 을 혼자서 외롭게 분석했습니다.

  • ARIMA 나 LSTM 같은 기존 모델: 마치 과거의 일기장만 보고 "어제 비가 왔으니 오늘도 비가 올 거야"라고 예측하는 것과 같습니다. 하지만 주식 시장은 비가 오지 않아도 갑자기 폭풍이 몰아칠 수 있습니다.
  • 문제점: 주식들은 서로 완전히 독립적이지 않습니다. 애플이 나빠지면 삼성도 영향을 받을 수 있고, 같은 '기술주'들은 서로 연동되어 움직입니다. 기존 모델은 이 친구들 사이의 관계를 무시했습니다.

2. 이 연구의 핵심 아이디어: "두 가지 슈퍼파워"

이 논문은 두 가지 강력한 도구를 합쳐서 **Node Transformer (노드 트랜스포머)**라는 새로운 AI 를 만들었습니다.

🔹 파워 1: 주식 시장 = 거대한 '연결된 그래프' (Graph)

  • 비유: 주식 시장을 한 학교의 학생들로 생각해보세요.
    • 노드 (Node): 각 학생 (각 주식).
    • 엣지 (Edge): 학생들 사이의 관계 (같은 반, 같은 동아리, 친구 사이).
  • 이 AI 는 각 주식을 따로 보는 게 아니라, **"애플이 움직이면 같은 IT 동아리인 마이크로소프트나 구글도 어떻게 반응할까?"**를 동시에 계산합니다. 마치 교실 전체의 분위기를 한눈에 파악하는 교장선생님처럼요.
  • 효과: 한 주식의 급등이나 급락을 다른 관련 주식들의 움직임과 연결지어 예측하므로, 훨씬 더 정확한 그림을 그릴 수 있습니다.

🔹 파워 2: BERT 를 이용한 '소문 감지' (Sentiment Analysis)

  • 비유: 주식 가격은 숫자만 있는 게 아니라, **사람들의 심리 (공포와 탐욕)**에 따라 움직입니다.
  • 이 AI 는 트위터 (X) 같은 SNS 에 올라온 수백만 개의 글을 **BERT(언어 이해 AI)**가 읽어보게 합니다.
    • "애플 제품 정말 대박이야!" → 긍정 (Positive)
    • "이 주식 망할 것 같아..." → 부정 (Negative)
  • 핵심: 숫자 (가격) 에는 나타나지 않는 **사람들의 '분위기'와 '소문'**을 미리 감지해서 예측에 반영합니다. 마치 시장 소문을 미리 듣고 투자하는 현명한 투자자처럼요.

3. 어떻게 합치나요? "스마트한 요리사" (Attention Fusion)

이 두 가지 정보를 어떻게 섞을까요? AI 는 상황에 따라 섞는 비율을 조절하는 요리사처럼 작동합니다.

  • 시장이 조용할 때: 과거 가격 데이터 (숫자) 를 더 많이 믿고 예측합니다.
  • 시장이 요동치거나 큰 뉴스가 날 때: SNS 의 감정 (소문) 정보를 더 많이 반영합니다.
  • 결과: 어떤 상황에서도 가장 적절한 조합으로 예측을 합니다.

🏆 결과가 어땠나요? (실험 결과)

이 새로운 AI 를 1982 년부터 2025 년까지의 20 개 대형 주식 (S&P 500) 으로 테스트했습니다.

  1. 정확도 대결:

    • 기존 모델 (ARIMA): 100 점 만점에 약 88 점 (오차 1.20%)
    • 기존 딥러닝 (LSTM): 90 점 (오차 1.00%)
    • 이 연구의 모델: 92 점 이상 (오차 0.80%)
    • 비유: 기존 모델이 "내일 주가가 100 원에서 101 원이 될 거야"라고 맞췄다면, 이 모델은 "100.8 원"까지 더 정밀하게 맞췄습니다.
  2. 방향성 예측 (오를지 내릴지):

    • 동전 던지기 (50%) 보다 훨씬 높은 **65%**의 정확도로 주가가 오를지 내릴지를 맞췄습니다.
  3. 위기 상황에서의 강점:

    • 시장이 크게 요동칠 때 (공포가 몰려올 때) 다른 모델들은 실수하지만, 이 모델은 감정 분석관계 분석 덕분에 더 잘 견뎌냈습니다.

💡 결론: 왜 이것이 중요한가요?

이 연구는 **"주식 시장은 혼자 움직이는 게 아니라, 서로 연결된 네트워크이고, 사람들의 감정까지 영향을 미친다"**는 사실을 AI 로 증명했습니다.

  • 기존: "과거의 숫자 패턴"만 보고 예측.
  • 이 연구: "숫자 + 친구 관계 + 사람들의 기분"을 모두 보고 예측.

마치 단순한 날씨 예보에서 기상 위성 + 지진계 + 지역 주민의 체감을 모두 종합하여 태풍 경보를 내리는 것과 같습니다. 투자자나 기관들은 이 기술을 통해 더 안전한 투자를 하고, 시장 변동성 속에서 더 나은 결정을 내릴 수 있게 될 것입니다.

한 줄 요약:

"주식 시장을 '외로운 숫자'가 아닌 '서로 연결된 사람들과 그들의 감정'으로 이해하게 만든 똑똑한 AI 입니다."