NCAA Bracket Prediction Using Machine Learning and Combinatorial Fusion Analysis

이 논문은 랭크-스코어 특성 함수와 인지 다양성을 활용한 결합적 융합 분석 (CFA) 을 통해 2024 년 NCAA 토너먼트 결과 예측 정확도를 기존 최상위 시스템보다 높은 74.60% 로 끌어올린 새로운 접근법을 제시합니다.

Yuanhong Wu, Isaiah Smith, Tushar Marwah, Michael Schroeter, Mohamed Rahouti, D. Frank Hsu

게시일 2026-03-12
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🏀 1. 문제: 농구 경기 예측은 왜 어려울까?

농구 경기, 특히 '마치 매드니스'는 예측하기 정말 어렵습니다.

  • 비유: 마치 날씨 예보를 하는 것과 비슷해요. 비가 올 확률이 70% 라도, 갑자기 돌풍이 불면 비가 안 올 수도 있죠.
  • 이유: 선수 부상, 팀 분위기, 심판 판정, 심지어 운까지 경기 결과에 영향을 미칩니다. 기존에 컴퓨터가 예측하는 방식은 주로 "A 팀이 이길 확률이 60% 입니다"라고 숫자 (점수) 만을 계산하는 데 그쳤습니다.

🧩 2. 해결책: "조합적 융합 분석 (CFA)"이라는 새로운 레시피

저자들은 기존 방식에 만족하지 않고, 여러 명의 전문가 (AI 모델) 들의 의견을 모아서 하나의 결론을 내리는 방법을 썼습니다. 이를 **CFA(Combinatorial Fusion Analysis)**라고 부르는데, 쉽게 말해 **"요리사 5 명이 각자 만든 요리를 섞어 새로운 메뉴를 만드는 과정"**입니다.

① 5 명의 요리사 (기초 모델 5 개)

저자들은 먼저 5 가지 다른 AI 모델을 훈련시켰습니다. 각 모델은 농구 데이터를 보는 눈이 조금씩 다릅니다.

  1. 로지스틱 회귀: 논리적이고 계산적인 요리사.
  2. SVM(서포트 벡터 머신): 선을 그어 구분하는 것을 좋아하는 요리사.
  3. 랜덤 포레스트: 수많은 나무 (의사결정) 를 만들어 보는 요리사.
  4. XGBoost: 이전 실수를 바로잡으며 성장하는 요리사.
  5. CNN(합성곱 신경망): 이미지나 복잡한 패턴을 보는 요리사.

② 요리사의 특징 파악 (인지 다양성)

여기서 중요한 건, 이 5 명이 서로 얼마나 다른지를 보는 것입니다.

  • 비유: 만약 5 명의 요리사 모두 "소금만 넣으면 맛있어"라고 말한다면, 그들을 모으는 건 의미가 없죠. 하지만 한 명은 "매운맛", 한 명은 "단맛", 한 명은 "신맛"을 강조한다면? 이들을 섞으면 훨씬 풍부한 맛이 나겠죠.
  • CFA 의 핵심: 이 5 모델이 서로 얼마나 다르게 (인지적 다양성) 생각하는지를 측정해서, 서로 다른 의견을 가진 모델들을 골라냅니다.

③ 두 가지 섞는 방법 (점수 vs 순위)

이제 이 5 명의 의견을 어떻게 합칠까요? 두 가지 방법이 있습니다.

  1. 점수 조합 (Score Combination): "A 팀이 이길 확률이 70% 입니다"라는 숫자를 평균내서 합칩니다.
  2. 순위 조합 (Rank Combination): "A 팀이 1 등, B 팀이 2 등"이라는 순위를 합칩니다.
    • 중요한 발견: 이 논문은 순위를 합치는 방법이 더 좋다는 것을 발견했습니다.
    • 비유: "A 팀이 70% 확률로 이길 거야"라고 숫자로 말하기보다, "A 팀이 B 팀보다 더 잘할 거야"라고 순위로 비교하는 것이 실제 경기 결과 (승/패) 를 예측하는 데 더 정확했습니다.

🏆 3. 결과: 기존 전문가들을 이겼다!

저자들은 지난 10 년간의 데이터를 가지고 이 방법을 테스트해 보았습니다.

  • 실험: 2022 년, 2021 년 등 과거 데이터를 이용해 어떤 모델 조합이 가장 잘 작동하는지 찾아냈습니다. (결국 로지스틱 회귀, SVM, CNN 이 섞인 조합이 가장 잘 작동했습니다.)
  • 2024 년 예측: 이 최적의 조합으로 2024 년 토너먼트를 예측했습니다.
  • 성적:
    • 기존 10 개 유명 순위 시스템 (NET Rankings 등) 의 최고 점수: 73.02%
    • 이 논문의 새로운 방법 (순위 조합): 74.60%
    • 결과: 기존 최고의 전문가들보다 1.58% 더 정확하게 예측했습니다.

💡 4. 핵심 교훈 (한 줄 요약)

"하나의 천재보다, 서로 다른 생각을 가진 5 명의 평범한 전문가들이 모여 서로의 의견을 섞으면 (특히 '순위'로 비교할 때), 훨씬 더 똑똑한 예측이 가능하다."

이 연구는 단순히 농구 경기 예측을 넘어, 여러 AI 모델을 어떻게 섞어야 가장 똑똑한 결과가 나오는지에 대한 새로운 통찰을 제공했습니다. 마치 다양한 재료를 섞어 최고의 요리를 만드는 것처럼, 데이터 과학에서도 '다양성'이 핵심 열쇠임을 보여준 흥미로운 연구입니다.