Regularization in Paired Comparison Models via Pseudo-Games and Phantom… — やさしい解説

原著者： Mark E. Glickman

公開日 2026-06-03✓ Author reviewed ⓘ

📖 1 分で読めます☕ さくっと読める

原著者： Mark E. Glickman

原論文は CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) でライセンスされています。 ✨ これは以下の論文のAI生成解説です。著者が執筆したものではありません。技術的な正確性については原論文を参照してください。免責事項の全文を読む

あなたは、あるグループの友人たちの間で、誰がビデオゲームで最も優れているかをランク付けしようとしていると想像してください。あなたには、誰が誰に勝ったかというリストがあります。

理想的な世界では、全員が他の全員と平等な回数対戦します。しかし現実には、たくさんプレイする人もいれば、少ししかプレイしない人もいます。また、非常に優れたプレイヤーが、観察した少数の試合の中で、特定の対戦相手に対して一度も負けないこともあるかもしれません。

問題：「完璧な」スコアの罠
プレイヤーAがプレイヤーBに5回連続で勝利した場合、標準的なコンピュータ計算（「最尤推定法」と呼ばれます）は、プレイヤーAがプレイヤーBよりも無限に優れていると結論付けてしまいます。それは、プレイヤーAが永遠に100%の確率で勝つと計算してしまうのです。

問題点： これは、その5回の試合については数学的に「正しい」のですが、将来の予測としてはひどいものです。私たちは、次にプレイヤーBが勝つ可能性があることを知っています。数学は、小さなサンプルを絶対的な真実として扱うことで破綻してしまうのです。これは、不合理な「無限」のスコアを導き出します。

解決策：「ゴースト・ゲーム」の追加
著者であるマーク・グリックマンは、説明が難しい複雑な数学的ペナルティを使用せずに、これを修正するための巧妙なトリックを提案しています。数式を変更するのではなく、**「偽のデータを混ぜる」**ことを提案しているのです。彼はこれを「疑似観測による正則化」と呼んでいます。

このように考えてみてください。実際のゲーム結果を見る前に、コンピュータに対して、「全員が『ゴースト』と呼ばれる対戦相手、あるいは互いに非常にバランスの取れた形で、数回の追加の試合を行ったと仮定してください」と指示するのです。

著者は、これら2つの具体的な方法を提案しています。

1. 「分数タイ（引き分け）」法（疑似ゲーム）

シーズンが始まる前に、すべてのプレイヤーが、目に見えない形で、互いにわずかな「引き分け」の試合を行ったと想像してください。

仕組み： すべての対戦データに対して、わずかな「勝ち」のクレジットと、わずかな「負け」のクレジットを追加します。
比喩： これはコンピュータに対して、「プレイヤーAがプレイヤーBに5回勝利したとしても、彼らが互いに分け合った（引き分けた）試合も数回あったと仮定してください」と伝えるようなものです。
結果： これにより、コンピュータが「プレイヤーAは無限に優れている」と言うのを防ぎます。スコアを互いに近づけ、より現実的な予測にします。これは、データの極端な部分を滑らかにするために、データに少しの「疑い」を加えるようなものです。

2. 「ゴースト・プレイヤー」法（幻のプレイヤー）

リーグには、謎めいた、目に見えないプレイヤー（ここでは「Mr. Zero」と呼びましょう）が存在すると想像してください。彼はまさに平均的な存在です。彼は決して疲れず、運に左右されず、そのスキルレベルは固定されています。

仕組み： すべての実際のプレイヤーが、Mr. Zeroと何回か対戦したと仮定します。そして、すべてのプレイヤーがMr. Zeroに対しては、半分は勝ち、半分は負けたとコンピュータに伝えます。
比喩： これはボートを係留するアンカー（錨）のようなものです。もしボート（プレイヤーのスコア）が遠くへ流されようとしたら（高くなりすぎたり低くなりすぎたりしたら）、アンカー（Mr. Zero）がそれを中央へと引き戻します。
結果： これにより、全員のスコアが地に足の着いたものになります。たとえあるプレイヤーが弱い相手に対して10連勝したとしても、彼が「Mr. Zeroに対しては半分負けている」という事実が、彼のスコアが無限に跳ね上がるのを防いでくれます。

なぜこれが素晴らしいのか

この論文は、これら2つの「偽のデータ」によるトリックが、非常に人気のある複雑な数学的手法である「リッジ正則化」（通常、恐ろしい見た目のペナルティ数式を伴うもの）と同じ役割を果たすことを示しています。

利点： 「数式に0.5のペナルティを適用した」と言う代わりに、「平均的な対戦相手に対して40回の偽の試合を追加した」と言うことができます。
翻訳： これにより、数学が一般の人々（スポーツアナリストやビジネスマネージャーなど）にとって非常に理解しやすくなります。彼らは単純な質問によってシステムを調整できます。「何回の偽の試合を追加すべきか？」や「平均的なプレイヤーをどの程度信頼すべきか？」といった具合です。

野球の例

著者はこれを2025年のメジャーリーグベースボール（MLB）シーズンでテストしました。

修正なしの場合： 2025年のMLBでは、すべてのチームが少なくとも1勝1敗を記録しており、データは完全に連結していました。そのため、修正を行わない通常の計算でもスコアは「無限」にはなりませんでした。しかし、スケジュールの偏り（誰が誰と対戦したか）の影響により、最強のチームと最弱のチームの能力差が過剰に楽観的かつ誇張されたものとして算出されてしまいました。つまり、実力差は存在しましたが、そのギャップが実際のものよりも極端に見えていたのです。
修正ありの場合： コンピュータは、各チームにより妥当なスコアを与えました。最強のチームが強く、最弱のチームが弱いことは依然として認識していましたが、その差を誇張することはありませんでした。「ゴースト・プレイヤー」法は非常にうまく機能し、複雑な「リッジ」数学の手法とほぼ同一の結果を生み出しましたが、その説明ははるかに簡単でした。

まとめ

この論文は、勝ち負けに基づいて何かをランク付けする場合、全員が数回の追加のバランスの取れた試合を行ったと**「仮定する」**ことで、異常な無限のスコアを回避できると主張しています。

方法A： 全員が他の全員に対して、わずかな引き分けを行ったと仮定する。
方法B： 全員が「平均的なゴースト」に対して、多くの試合を行ったと仮定する。

どちらの方法も、数学をシンプルに保ち、予測を現実的なものにし、そして単に誰が本当に最高なのかを知りたいと考えているすべての人に対して、結果を理解しやすくしてくれます。

技術要約：疑似ゲームとファントムプレイヤーを用いた対比較モデルにおける正則化

問題提起
ブラッドリー・テリー（Bradley-Terry）モデルやサーストン・モステラー（Thurstone-Mosteller）モデルなどの対比較モデルは、二値の結果から潜在的な能力や好みを推定するための標準的なツールである。しかし、比較グラフが非連結である場合や、ほぼ分離している場合、通常の最尤推定（MLE）は重大な不安定性に直面する。このようなケースは、不完全なスケジュールを持つスポーツ、疎な嗜好調査、あるいは新規参入者がいるオンラインランキングシステムなどで一般的に見られる。このような場合、尤度は境界上でしか最大化されず、結果として無限の能力推定値（例： $+\infty$ および $-\infty$ ）をもたらす。リッジ正則化は、パラメータを共通の中心へと収縮させることでこれに対処するが、実務家にとって魅力的な根拠となる直感的な尤度の解釈を不明瞭にしてしまう。さらに、リッジペナルティは、位置の非識別性を解決するために明示的な線形制約を必要とする。

手法
本論文は、馴染みのある尤度の形式を維持しつつ、有限で収縮した推定値をもたらす、二つのデータ拡張の観点からの正則化を提案する。両手法とも、標準的な二項回帰ソフトウェア（例：Rのglm）を通じて実装が可能である。

疑似ゲーム（Pseudo-Game）正則化:
この手法は、観測されたデータに対して、分数的な「疑似ゲーム」を追加する。すべての順序なしの対 $(i, j)$ について、両プレイヤーに $\delta$ の分数的な勝利と $\delta$ の分数的な敗北を加える。

メカニズム: 拡張された対数尤度には、 $\sum \log\{p_{ij}(1-p_{ij})\}$ に比例するペナルティ項が含まれる。この項は $p_{ij} = 1/2$ （能力が等しい状態）のときに最大化され、それによって能力の差をゼロへと収縮させる。
特性: これはペアごとの能力差に作用する。位置の非識別性は解決しないため、線形制約（例： $\sum \theta_j = 0$ ）が引き続き必要となる。
リッジとの関連: ブラッドリー・テリーのロジットリンクの下で、ゼロ近傍でのテイラー展開を行うと、このペナルティは局所的に係数 $\lambda \approx \delta J / 4$ を持つリッジペナルティとして振る舞うことが示される。

ファントムプレイヤー（Phantom-Player）正則化:
この手法は、固定された既知の強さ $\theta_0 = 0$ を持つ人工的な「ファントム（幽霊）」競技者（インデックス0）を導入する。各実在の競技者は、このファントムプレイヤーに対して、重み $\rho$ で割り当てられた疑似的な勝利と疑似的な敗北を与えられる。

メカニズム: 拡張された対数尤度は、 $\rho \sum [\log F(\theta_j) + \log\{1 - F(\theta_j)\}]$ という項を加える。このペナルティは $\theta_j = 0$ で最大化され、個々の能力をファントムプレイヤーの固定された強さへと収縮させる。
特性: これは、単なる差ではなく、個々のパラメータ $\theta_j$ に直接作用する。決定的なのは、ファントムプレイヤーがスケールを固定するため、明示的な和ゼロ制約を必要とせずに位置の非識別性を解決できる点である。
リッジとの関連: ブラッドリー・テリーモデルにおいて、これは局所的に $\lambda \approx \rho / 4$ のリッジ正則化と等価である。しかし、二次的なリッジペナルティとは異なり、ファントムプレイヤーのペナルティは大きな $|\theta_j|$ に対して近似的に線形な裾を持つ。

チューニングと推論
チューニングパラメータ $\delta$ と $\rho$ は、専門家の知見による抽出（elicitation）または交差検証によって選択される。

抽出: $\delta$ は、アナリストが「1勝（敗北なし）」という観測結果に対し、将来の勝利に対してどのような確率 $q$ を割り当てるか、という問いに基づき、 $\delta = (1-q)/(2q-1)$ として較正できる。 $\rho$ は、参照となる対戦相手に対する重み付きの疑似勝利および疑似敗北の数として解釈される。
交差検証: $K$ 分割交差検証は、保持された（held-out）対数尤度を最大化する。論文では、最終的な適合から得られる標準誤差は、選択されたチューニングパラメータに条件付けられたものであるとして扱う必要があると述べており、適切な不確実性の定量化のためにブートストラップ法による全手順の実行を推奨している。
ベイズ的解釈: 本論文は、ファントミプレイヤー正則化が、密度が $[F(\theta_j)(1-F(\theta_j))]^\rho$ に比例する独立した収縮事前分布の下での最大事後確率（MAP）推定値に対応することを指摘している。

結果：2025年メジャーリーグベースボール（MLB）への適用
これらの手法は、2025年のMLBレギュラーシーズン（30チーム、2,430試合）に適用された。データグラフは連結していたため（通常のMLEが可能）、スケジュールは不均衡であり、極端な推定値を生む可能性があった。

比較: 著者らは、通常のブラッドリー・テリー、リッジ正則化、疑似ゲーム、およびファントムプレイヤー・モデルを比較した。
知見:
- 通常の推定値は最も広い広がりを示した（例：コロラド・ロッキーズが $-0.979$）。
- 正則化手法は、これらの極端な値を大幅に収縮させた（例：ロッキーズの推定値は $-0.580 $から$ -0.643$ の範囲に収まった）。
- ファントムプレイヤーによる推定値は、リッジ正則化による推定値に特に近く、トップからボトムまでの広がりは、およそ3分の1から5分の2程度減少した。
- ファントムプレイヤーの手法は、リッジ正則化による強さの推定値を再現しつつ、直感的な拡張データ表現を維持することに成功した。

主要な貢献と意義
本論文の主要な貢献は、単純なデータ拡張構成（疑似ゲームおよびファントムプレイヤー）が、対比較モデルに対して解釈可能な正則化ペナルティをもたらすことを示した点にある。

解釈性: 抽象的なリッジペナルティとは異なり、これらの手法により、実務家は正則化を「分数的なゲーム」や「参照となる対戦相手との比較」という言葉で議論することができる。
実装: これらの手法は標準的な一般化線形モデル（GLM）ソフトウェアを活用しており、カスタムの最適化コードを必要とせず、応用分析家にとってアクセスしやすい。
識別性: ファントムプレイヤーの構成は、データ拡張を通じて自然に位置の非識別性を解決するという明確な利点を提供し、明示的な線形制約を排除する。
架け橋: 本研究は、ペナルティ付き最適化と尤度ベースのモデリングの架け橋となり、正則化を単なる数学的なペナルティではなく、注意深く制御された情報の追加として定義している。

結論として、これらの手法には限界（例：非常に疎なデータにおける交差検証の不安定性）があるものの、標準的なリッジ正則化に対して、堅牢で直感的な代替案を提供するものである。

Regularization in Paired Comparison Models via Pseudo-Games and Phantom Players

1. 「分数タイ（引き分け）」法（疑似ゲーム）

2. 「ゴースト・プレイヤー」法（幻のプレイヤー）

なぜこれが素晴らしいのか

野球の例

まとめ

関連論文