FactorEngine: A Program-level Knowledge-Infused Factor Mining Framework for Quantitative Investment

이 논문은 LLM 기반의 방향성 탐색과 지식 주입 부트스트래핑 모듈을 통해 해석 가능하고 실행 가능한 예측 인자 (alpha factor) 를 자동으로 발굴하여 기존 방법론보다 뛰어난 예측 안정성과 포트폴리오 성과를 달성하는 'FactorEngine' 프레임워크를 제안합니다.

Qinhong Lin, Ruitao Feng, Yinglun Feng, Zhenxin Huang, Yukun Chen, Zhongliang Yang, Linna Zhou, Binjie Fei, Jiaqi Liu, Yu Li

게시일 2026-03-18
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 왜 새로운 시스템이 필요했을까요? (기존의 문제점)

주식 투자를 할 때 우리는 "어떤 공식을 쓰면 주가가 오를까?"를 끊임없이 고민합니다. 기존에는 크게 두 가지 방식이 있었지만, 둘 다 한계가 있었습니다.

  • 방식 A: 수학 공식만 믿는 사람 (기호 기반)
    • 비유: 요리사에게 "소금, 설탕, 간장만 섞어라"라고 제한된 재료만 준 경우입니다.
    • 문제: 재료가 너무 적어서 맛있는 새로운 요리 (예: 매운탕) 를 만들 수 없습니다. 시장이 변하면 금방 맛이 없어집니다.
  • 방식 B: AI 가 다 알아서 하는 사람 (신경망 기반)
    • 비유: AI 가 맛없는 음식을 만들어도 "왜 그런지" 설명을 못 하는 경우입니다.
    • 문제: AI 가 너무 많은 데이터를 외워서 (과적합), 실제 시장에서 실패할 때 왜 실패했는지 알 수 없어 위험합니다.

2. FactorEngine 은 무엇인가요? (핵심 아이디어)

FactorEngine 은 **"코딩을 할 줄 아는 요리사"**입니다. 이 시스템은 단순히 수식만 만드는 게 아니라, 파이썬 (Python) 코드로 된 완전한 프로그램을 만들어냅니다.

비유: 기존 방식이 "레시피 카드"만 주고 있다면, FactorEngine 은 **"요리사 로봇"**을 줍니다. 이 로봇은 레시피를 읽고, 재료를 사오고, 요리하고, 맛을 본 뒤 "다음엔 소금을 조금 덜 넣고, 불을 더 세게 해보자"며 스스로 레시피를 고쳐 나갑니다.

3. FactorEngine 의 3 가지 비밀 무기

이 시스템이 다른 것들보다 뛰어난 이유는 세 가지 전략을 섞었기 때문입니다.

① "아이디어"와 "숫자"를 분리하다 (논리 vs 파라미터)

  • 상황: 요리사가 "새로운 메뉴를 개발하자 (아이디어)"고 생각할 때, 동시에 "소금 3g, 3.5g, 4g 중 어느 게 좋을까 (숫자)"를 고민하면 머리가 아픕니다.
  • FactorEngine 의 해결:
    • LLM(거대 언어 모델) 요리사: "새로운 메뉴 아이디어"를 내고, "왜 이 레시피가 좋은지"를 설명합니다. (논리 수정)
    • 컴퓨터 계산기: "소금 3g vs 4g"처럼 숫자만 빠르게 테스트해 최적의 값을 찾아냅니다. (파라미터 최적화)
    • 효과: 두 가지 일을 동시에 하지 않아 훨씬 빠르고 똑똑해집니다.

② "실패 경험"을 배우는 지도 (경험의 사슬)

  • 상황: 요리사가 실패한 요리를 보고 "아, 불이 너무 세서 탔구나"라고 배워야 합니다.
  • FactorEngine 의 해결: 시스템은 과거의 모든 시도 (성공한 것뿐만 아니라 실패한 것까지) 를 기록합니다. "어떤 레시피를 고쳤더니 실패했더라"라는 **경험의 사슬 (Chain of Experience)**을 AI 에게 보여줍니다.
  • 효과: AI 는 실패를 두려워하지 않고, 실패한 경로를 분석해서 더 나은 방향으로 나아갑니다.

③ "섬"을 만들어 함께 발전하다 (다중 섬 진화)

  • 상황: 요리사 한 명이 고립되어 있으면 새로운 아이디어가 나오기 어렵습니다.
  • FactorEngine 의 해결: 여러 개의 독립된 '섬' (프로세스) 을 만들어 각기 다른 레시피를 개발하게 합니다. 일정 시간이 지나면 각 섬에서 가장 맛있는 요리를 다른 섬에 가져와 공유합니다.
  • 효과: 한 섬에서 발견한 좋은 아이디어가 다른 섬으로 퍼져나가 전체적인 요리 실력이 급격히 향상됩니다.

4. 실제 성과는 어떨까요?

이 시스템을 실제 주식 시장 데이터 (한국 증시 등) 로 테스트한 결과는 매우 훌륭했습니다.

  • 예측 정확도: 기존 최고의 방법들보다 주가 상승/하락을 더 정확하게 예측했습니다.
  • 수익률: 투자 포트폴리오의 수익률이 크게 증가했고, 손실 (최대 낙폭) 은 줄였습니다.
  • 다양성: 같은 종류의 요리 (유사한 주식 공식을) 를 많이 만들지 않고, 서로 다른 다양한 레시피를 만들어내어 위험을 분산시켰습니다.
  • 가독성: AI 가 만든 코드는 사람이 읽을 수 있어, "왜 이 공식이 돈을 벌게 했는지"를 검증할 수 있습니다.

5. 한 줄 요약

FactorEngine은 "수학 공식만 고집하거나, 블랙박스 AI 에만 의존하지 않고, 코딩을 할 줄 아는 AI 요리사에게 시장이라는 주방을 맡겨, 실패 경험을 바탕으로 스스로 레시피를 고쳐가며 최고의 수익을 내는 시스템을 만든 것"입니다.

이 시스템은 금융 전문가들이 수동으로 하던 복잡한 작업을 자동화하면서도, 그 과정이 투명하고 검증 가능하도록 만들어 투자 시장의 새로운 표준을 제시합니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →