원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기
당신은 친구들의 비디오 게임 실력을 순위 매기려고 한다고 상상해 보세요. 당신에게는 누가 누구를 이겼는지에 대한 목록이 있습니다.
이상적인 세상이라면 모든 사람이 서로 같은 횟수만큼 경기를 치러야 합니다. 하지만 현실에서는 어떤 사람은 경기를 아주 많이 하고, 어떤 사람은 아주 적게 하며, 때로는 정말 뛰어난 선수가 당신이 관찰한 적은 표본 안에서는 특정 상대에게 단 한 번도 패하지 않을 수도 있습니다.
문제점: "완벽한" 점수의 함정
플레이어 A 가 플레이어 B 를 다섯 번 연속으로 이긴다면, 표준 컴퓨터 계산 방식 (흔히 "최대 우도법"이라 불리는 방식) 은 플레이어 A 가 플레이어 B 보다 무한히 더 뛰어나다고 결론 내릴 것입니다. 이는 플레이어 A 가 영원히 100% 의 확률로 승리할 것이라고 계산하는 것입니다.
- 문제점: 이는 다섯 번의 경기 데이터에 대해서는 수학적으로 "옳은" 것이지만, 미래를 예측하기에는 끔찍한 결과입니다. 플레이어 B 가 다음번에는 이길 수도 있다는 것을 우리는 알고 있습니다. 이 수학적 모델은 작은 표본을 절대적인 진리로 취급하기 때문에 무너집니다. 즉, "무한대"의 점수를 만들어내며 상식 밖의 결과를 초래합니다.
해결책: "유령 게임" 추가하기
저자인 마크 글릭만 (Mark Glickman) 은 설명하기 어려운 복잡한 수학적 페널티를 사용하는 대신, 이 문제를 해결할 수 있는 영리한 트릭을 제안합니다. 공식을 바꾸는 대신, 가짜 데이터를 섞는 것입니다. 그는 이를 "의사 관측치를 통한 정규화 (Regularization via Pseudo-Observations)"라고 부릅니다.
이렇게 생각해보세요. 실제 시즌의 결과가 나오기 전에, 모든 플레이어가 '유령' 상대와 혹은 서로 아주 균형 잡힌 방식으로 몇 번의 추가 경기를 치렀다고 가정하는 것입니다.
이 논문은 두 가지 구체적인 방법을 제안합니다.
1. "분수 타이 (Fractional Tie)" 방식 (의사 게임)
모든 실제 시즌이 시작되기 전, 모든 플레이어가 서로 아주 미세한 '무승부' 경기를 치렀다고 상상해 보세요.
- 작동 방식: 당신의 데이터에 있는 모든 맞대결에 대해 승리 점수를 아주 조금 더하고, 패배 점수를 아주 조금 더 뺍니다.
- 비유: 이는 컴퓨터에게 "플레이어 A 가 플레이어 B 를 다섯 번 이겼더라도, 두 사람이 점수를 절반씩 나눠 가진 경기도 몇 번 치렀다고 가정해라"라고 말하는 것과 같습니다.
- 결과: 이는 컴퓨터가 "플레이어 A 가 무한히 더 뛰어나다"라고 말하는 것을 막아줍니다. 점수를 서로 가깝게 끌어당겨 예측을 더 현실적으로 만듭니다. 이는 데이터에 약간의 "의구심"을 더해 극단적인 값을 완화하는 것과 같습니다.
2. "유령 플레이어" 방식 (팬텀 플레이어)
리그에 신비롭고 보이지 않는 플레이어 (이름을 "Mr. Zero"라고 합시다) 가 있다고 상상해 보세요. 그는 정확히 평균적인 수준이며, 지치지도 않고 운이 좋지도 않으며, 그의 실력은 고정되어 있습니다.
- 작동 방식: 모든 실제 플레이어가 "Mr. Zero"를 상대로 여러 경기를 치렀다고 가정합니다. 모든 플레이어가 Mr. Zero 를 상대로 절반은 이기고 절반은 졌다고 컴퓨터에게 알려줍니다.
- 비유: 이는 배를 닻으로 고정하는 것과 같습니다. 배 (플레이어의 점수) 가 너무 멀리 떠내려가려 하면 (점수가 너무 높아지거나 낮아지면), 닻 (Mr. Zero) 이 그것을 중앙으로 다시 끌어당깁니다.
- 결과: 이는 모두의 점수를 안정적으로 유지해 줍니다. 어떤 플레이어가 약한 상대들을 상대로 10 연승을 거두더라도, 그들이 "평균적인 유령 플레이어"를 상대로는 절반의 경기에서 졌다는 사실 덕분에 그들의 점수가 무한대로 치솟는 것을 방지합니다.
왜 이것이 멋진가
이 논문은 이 두 가지 "가짜 데이터" 트릭이 매우 인기 있고 복잡한 수학 기법인 "릿지 정규화 (Ridge Regularization)"(보통 무서워 보이는 페널티 공식이 포함됨) 와 동일한 역할을 한다는 것을 보여줍니다.
- 이점: "우리는 수학에 0.5 의 페널티를 적용했다"라고 말하는 대신, "우리는 평균적인 상대와 40 번의 가짜 경기를 추가했다"라고 말할 수 있습니다.
- 번역: 이는 수학을 일반인들 (스포츠 분석가나 비즈니스 매니저 등) 이 이해하기 훨씬 쉽게 만들어 줍니다. 그들은 단순한 질문을 통해 시스템을 조정할 수 있습니다. "가짜 경기를 몇 번 추가해야 하는가?" 또는 "평균적인 플레이어를 얼마나 신뢰해야 하는가?"와 같은 질문 말이죠.
야구 사례
저자는 이 방법을 2025 년 메이저리그 베이스볼 (MLB) 시즌에 테스트했습니다.
- 해결책이 없을 때: 경기 일정이 불균형했기 때문에, 컴퓨터는 정규 추정법을 사용했을 때 최상위 팀과 최하위 팀의 실력 차이를 지나치게 과장하여 추정했습니다. 즉, 최고의 팀은 실제보다 훨씬 더 뛰어나고, 최하위 팀은 실제보다 훨씬 더 부진한 것처럼 보였습니다. (참고: 모든 팀이 승패를 모두 기록했기 때문에 점수가 '무한대'가 된 것은 아니지만, 추정된 격차는 현실보다 훨씬 극단적이었습니다.)
- 해결책이 있을 때: 컴퓨터는 팀들에게 더 합리적인 점수를 부여했습니다. 최고의 팀이 뛰어나고 최악의 팀이 형편없다는 것은 여전히 인지하면서도, 그 격차를 과장하지 않았습니다. "유령 플레이어" 방식은 매우 효과적이어서, 복잡한 "릿지" 수학 방법과 거의 동일한 결과를 만들어냈으면서도 훨씬 설명하기 쉬웠습니다.
요약
이 논문은 승패를 바탕으로 순위를 매길 때, 모든 사람이 몇 번의 추가적인 균형 잡힌 경기를 치렀다고 가정함으로써 터무니없는 무한대 점수를 피할 수 있다고 주장합니다.
- 방법 A: 모든 사람이 서로와 아주 미세한 무승부를 기록했다고 가정합니다.
- 방법 B: 모든 플레이어가 "평균적인" 유령을 상대로 여러 경기를 치렀다고 가정합니다.
두 방법 모두 수학을 단순하게 유지하고, 예측을 현실적으로 만들며, 결과를 누구나 이해하기 쉽게 만들어 줍니다.
연구 분야의 논문에 파묻히고 계신가요?
연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.