Learning Risk Preferences in Markov Decision Processes: an Application to the Fourth Down Decision in the National Football League

이 논문은 역최적화 기법을 활용하여 NFL 코치들의 4 차 다운 결정이 통계적 모델과 다른 이유를 분석한 결과, 코치들이 전반적으로 보수적인 위험 선호를 보이지만 경기장 위치와 시대에 따라 위험 감수성이 달라진다는 사실을 규명했습니다.

Nathan Sandholtz, Lucas Wu, Martin Puterman, Timothy C. Y. Chan

게시일 2026-03-06
📖 3 분 읽기🧠 심층 분석

Each language version is independently generated for its own context, not a direct translation.

🏈 제목: "코치들의 마음속 '위험 감수 지수'를 찾아서"

1. 문제 상황: "왜 코치들은 너무 보수적일까?"

미국 풋볼 경기에서 팀은 4 번의 기회 (다운) 를 주어 10 야드를 전진해야 합니다. 4 번째 다운에 다다르면 코치는 두 가지 선택을 해야 합니다.

  1. 공격 (Go for it): 10 야드를 더 전진해서 다시 기회를 얻으려 시도한다. (성공하면 계속 공격, 실패하면 공을 바로 넘겨줌)
  2. 패스 (Punt/Field Goal): 공을 멀리 차서 상대팀이 공을 받을 위치를 뒤로 밀어내거나, 골대 근처라면 득점을 시도한다. (공을 넘겨주지만 상대팀의 공격 시작 위치를 나쁘게 만듦)

기존 연구들은 "통계적으로 보면 공격을 시도하는 것이 이길 확률이 더 높은데, 왜 코치들은 무조건 공을 차버려?"라고 지적해 왔습니다. 마치 주식 투자에서 "무조건 안전하니까 현금만 들고 있으라"고 조언하는 전문가가 있는데, 실제 투자자들은 그 조언을 안 듣는 것과 비슷합니다.

2. 이 연구의 핵심 아이디어: "코치들은 틀린 게 아니라, 기준이 다를 뿐이다"

이 연구의 저자들은 "코치들이 멍청해서 그런 게 아니다. 그들이 위험을 대하는 기준이 우리가 생각하는 통계적 평균 (기대값) 과 다를 뿐이다"라고 가정했습니다.

  • 비유:
    • 통계적 모델 (기존): "평균적으로 이길 확률이 51% 라면 공격하라." (평균을 중시)
    • 코치의 마음 (이 연구): "비록 평균은 높지만, **최악의 상황 (실패해서 공을 뺏기는 것)**이 너무 싫어서 차라리 안전한 선택을 하겠다." (최악을 피하는 것을 중시)

저자들은 코치들이 실제로는 **'최악의 시나리오'를 얼마나 두려워하는지 (위험 회피 성향)**를 수학적으로 역추적 (Inverse Optimization) 해내려 했습니다.

3. 방법론: "코치들의 행동을 거꾸로 읽는 마법"

이 연구는 **'역최적화 (Inverse Optimization)'**라는 방법을 썼습니다.

  • 정방향 문제 (Forward): "이 규칙을 따르면 어떤 결과가 나올까?" (예: 이 코치가 위험을 싫어하면 어떻게 행동할까?)
  • 역방향 문제 (Inverse): "코치가 이런 행동을 했다면, 그가 따르는 규칙은 무엇일까?" (예: 코치가 이렇게 행동했으니, 그의 '위험 감수 지수'는 얼마일까?)

저자들은 2014 년부터 2022 년까지의 NFL 경기 데이터를 모두 분석했습니다. 마치 수천 번의 게임을 녹화해두고, 코치들이 왜 그런 선택을 했는지 그 '심리 상태'를 역으로 계산해낸 것입니다.

4. 주요 발견: "코치들의 비밀스러운 심리"

이 연구를 통해 밝혀진 놀라운 사실들은 다음과 같습니다.

① 코치들은 '최악의 상황'을 매우 두려워한다 (보수적 성향)
코치들은 통계적으로 이길 확률이 높아도, 실패했을 때의 충격을 너무 크게 생각해서 공격을 포기합니다.

  • 비유: "내일 시험을 볼 때, 90 점 맞을 확률이 80% 라 해도, 0 점 맞을 확률이 20% 라면 불안해서 공부를 안 하겠다"고 생각하는 것과 비슷합니다. 연구에 따르면 코치들은 이 0 점 (최악) 을 피하는 데 집착합니다.

② 위치가 중요했다: "상대 진영에서는 대담해진다"
코치들의 성향은 그들이 있는 위치 (자진 vs 상대 진영) 에 따라 확 바뀝니다.

  • 자진 (Own Half): 공을 잃으면 바로 상대에게 좋은 위치를 넘겨줘야 하므로, 매우 보수적입니다. (공을 차버림)
  • 상대 진영 (Opponent Half): 이미 상대 진영에 깊숙이 들어와 있으니, 실패해도 크게 잃을 게 없습니다. 그래서 위험을 감수하고 공격을 시도합니다.
  • 비유: "집 앞에서 길 잃으면 무서워서 집에 들어가고 싶지만, 이미 상대 집 마당에 들어와 있으면 '뭐 어때, 넘어지면 넘어지지'라고 생각하며 대담해지는 것"과 같습니다.

③ 시간이 지날수록 더 대담해지고 있다
최근 (2022 년) 코치들은 과거 (2014 년) 에 비해 위험을 감수하는 경향이 강해졌습니다. 젊은 코치들이나 새로운 전략을 도입하는 팀들이 늘어나면서, "통계적으로 이기는 게 맞다"는 말을 조금씩 듣기 시작했다는 뜻입니다.

5. 결론: "코치들의 마음을 이해하면 게임이 바뀐다"

이 연구는 단순히 "코치들이 틀렸다"고 비난하는 것이 아니라, **"코치들이 왜 그런 결정을 내리는지 그 심리적 기준 (위험 감수 지수) 을 숫자로 증명"**했습니다.

  • 의미: 이제 분석가들은 코치들에게 "네가 너무 보수적이야"라고 말하기보다, "네가 두려워하는 '최악의 상황'을 통계적으로 계산해보니, 실제로는 공격하는 게 더 안전해. 그 두려움을 줄여보자"라고 설득할 수 있는 근거를 갖게 되었습니다.

한 줄 요약:

"NFL 코치들은 통계적 평균보다 '최악의 상황'을 더 두려워해서 보수적으로 행동하지만, 최근에는 그 두려움이 줄어들며 조금 더 대담해지고 있다."

이 연구는 스포츠뿐만 아니라, 사람들이 왜 합리적인 선택 대신 '안전한 선택'을 하는지를 이해하는 데 도움이 되는 통찰을 제공합니다.