VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis

이 논문은 과거 주가 데이터의 텍스트와 차트 이미지를 결합하여 Vision-Language Model(VLM) 을 활용하는 훈련 없는 프레임워크인 VISTA 를 제안하고, 이를 통해 기존 통계 모델 및 텍스트 기반 LLM 보다 최대 89.83% 높은 정확도로 주가 예측 성능을 입증했습니다.

Tina Khezresmaeilzadeh, Parsa Razmara, Seyedarmin Azizi, Mohammad Erfan Sadeghi, Erfan Baghaei Potraghloo

게시일 2026-03-10
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 핵심 아이디어: "숫자만 외우는 학생 vs 그림도 보는 학생"

주식 가격을 예측하는 일은 마치 내일 날씨를 예측하는 것과 비슷합니다.

  • 기존 방식 (숫자만 보는 LLM):
    과거의 기온이 "25 도, 26 도, 25 도, 24 도..."라고 숫자만 나열되어 있다면, 컴퓨터는 "아, 1 도씩 오르내리네. 내일도 비슷하겠지?"라고 추측합니다. 하지만 이 숫자 나열만으로는 '갑자기 비가 올 것 같은 구름'이나 '바람의 방향' 같은 중요한 맥락을 놓치기 쉽습니다.

  • 새로운 방식 (VISTA):
    이제 이 컴퓨터에게 **숫자 나열뿐만 아니라, 그 숫자가 그려진 '기온 그래프'**도 보여줍니다.
    "오, 이 그래프를 보니 3 일째 고점을 찍고 내려가는 '삼각형 모양'이네? 이건 비가 올 징조야!"라고 눈으로 패턴을 파악하게 됩니다.

VISTA는 이 두 가지 정보 (숫자 텍스트 + 그래프 이미지) 를 동시에 보고, "왜 이렇게 될 것 같은지" 이유를 하나씩 설명하며 (Chain-of-Thought) 최종 예측을 내놓는 똑똑한 비서입니다.

2. 왜 그래프 (그림) 가 중요한가요?

논문의 3 장에 아주 재미있는 예시가 나옵니다.

  • 상황: 주식 가격이 100 원, 102 원, 101 원, 100 원... 이렇게 왔다 갔다 합니다.
  • 숫자만 본 AI: "아, 계속 요동치네. 다음엔 102 원, 101 원이겠지?"라고 무작위적으로 예측합니다.
  • 그래프도 본 AI (VISTA): "잠깐, 이 그래프를 보니 가격이 101 원 선에 계속 부딪히다가 떨어지는 '내리막 삼각형' 모양이야. 주식 용어로 '저항선'이 깨질 것 같아. 다음엔 101 원, 100 원으로 떨어지겠어!"라고 패턴을 읽어서 더 정확한 예측을 합니다.

비유하자면:

  • 숫자만 보는 것: 친구가 "내일 10 시에 만나자, 11 시에 만나자, 10 시에 만나자..."라고 말만 반복하는 것을 듣는 것입니다.
  • 그래프도 보는 것: 친구의 표정과 손짓을 보며 "아, 친구가 시간이 없으니까 빨리 만나자고 급하게 말하는구나"라고 상황을 파악하는 것입니다.

3. 이 방법이 얼마나 잘 먹힐까? (실험 결과)

연구진은 유명한 AI 모델들 (LLM) 과 VISTA(그래프를 보는 AI) 를 주식 데이터로 시험해 봤습니다.

  • 결과: VISTA 는 숫자만 보는 AI 보다 최대 89% 까지 더 정확하게 예측했습니다.
  • 비유: 같은 문제를 풀 때, 숫자만 외운 학생보다 그래프를 보고 흐름을 파악한 학생이 훨씬 좋은 점수를 받은 셈입니다.

또한, AI 에게 **"단순히 답만 말하지 말고, 왜 그렇게 생각했는지 단계별로 설명해 봐"**라고 요청하면 (이걸 'Chain-of-Thought'라고 합니다), 더 정확한 답을 내놓는다는 것도 발견했습니다.

4. 기존 방법 (ARIMA) 과 비교는 어떨까?

전통적인 통계 프로그램 (ARIMA) 은 주식 예측의 '베테랑'입니다. 하지만 이 프로그램은 데이터가 적거나 복잡한 패턴 앞에서는 약점이 있습니다.

  • ARIMA: "과거 100 일 데이터만 보고 수학적 공식을 적용해서 예측" (정교하지만 유연하지 않음)
  • VISTA: "과거 데이터 + 그래프 모양 + 논리적 추론" (유연하고 직관적임)

실험 결과, VISTA 는 전통적인 통계 프로그램보다도 더 잘 맞췄습니다. 특히 주식처럼 **잡음 (Noise)**이 많고 예측하기 어려운 시장에서 그래프의 시각적 정보가 큰 도움을 주었습니다.

5. 결론: 왜 이 연구가 중요할까?

이 연구의 가장 큰 장점은 **"학습 (Training) 이 필요 없다"**는 점입니다.

  • 보통 AI 를 주식 예측에 쓰려면 엄청난 양의 데이터로 수개월 동안 가르쳐야 합니다.
  • 하지만 VISTA는 이미 세상을 잘 알고 있는 거대 AI 모델에 **"주식 차트도 보여주고, 숫자도 읽어줘"**라고 말만 하면 바로 작동합니다.

한 줄 요약:

"주식 차트의 그림을 보고, 숫자를 읽으며, 논리적으로 생각하게 만든 AI 가 기존 방식보다 훨씬 똑똑하게 주가를 예측한다!"

이 기술이 발전하면, 전문적인 금융 지식이 없는 일반인도 복잡한 차트를 분석할 수 있는 똑똑한 도구를 무료로 사용할 수 있게 될 것입니다.