Regularization in Paired Comparison Models via Pseudo-Games and Phantom Players

Dieses Paper führt zwei Datenaugmentationsstrategien ein – fraktionale Pseudo-Spiele und Phantomspieler –, um eine intuitive, interpretierbare Regularisierung für Paarvergleichsmodelle bereitzustellen, welche die Schätzungen effektiv stabilisiert und Identifizierbarkeitsprobleme löst, während sie die Ergebnisse der Standard-Ridge-Regularisierung eng repliziert.

Ursprüngliche Autoren: Mark E. Glickman

Veröffentlicht 2026-06-03✓ Author reviewed
📖 5 Min. Lesezeit🧠 Tiefgang

Ursprüngliche Autoren: Mark E. Glickman

Originalarbeit lizenziert unter CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dies ist eine KI-generierte Erklärung des untenstehenden Papers. Sie wurde nicht von den Autoren verfasst. Für technische Genauigkeit konsultieren Sie das Originalpaper. Vollständigen Haftungsausschluss lesen

Stellen Sie sich vor, Sie versuchen, eine Gruppe von Freunden danach zu ranken, wer am besten in einem Videospiel ist. Sie haben eine Liste darüber, wer gegen wen gewonnen hat.

In einer perfekten Welt würde jeder jeden eine gleiche Anzahl von Malen spielen. Aber in der Realität spielen manche viel, manche wenig, und manchmal gewinnt ein wirklich guter Spieler gegen einen bestimmten Gegner in der kleinen Stichprobe der Spiele, die Sie beobachtet haben, nie.

Das Problem: Die „perfekte" Score-Falle
Wenn Spieler A den Spieler B fünfmal hintereinander besiegt, kommt eine Standard-Computerberechnung (genannt „Maximum Likelihood") zu dem Schluss, dass Spieler A unendlich viel besser ist als Spieler B. Sie berechnet, dass Spieler A eine 100%ige Chance hat, für immer zu gewinnen.

  • Das Problem: Dies ist für diese fünf Spiele mathematisch „korrekt", aber es ist eine schreckliche Vorhersage für die Zukunft. Wir wissen, dass Spieler B beim nächsten Mal gewinnen könnte. Die Mathematik bricht zusammen, weil sie eine kleine Stichprobe als absolute Wahrheit behandelt und zu „unendlichen" Werten führt, die keinen Sinn ergeben.

Die Lösung: „Geisterspiele" hinzufügen
Der Autor, Mark Glickman, schlägt einen cleveren Trick vor, um dies zu beheben, ohne komplizierte mathematische Strafen zu verwenden, die schwer zu erklären sind. Anstatt die Formel zu ändern, schlägt er vor, falsche Daten in die Mischung einzufügen. Er nennt dies „Regularisierung durch Pseudo-Beobachtungen".

Denken Sie an Folgendes: Bevor Sie sich überhaupt die echten Spielergebnisse ansehen, sagen Sie dem Computer: „Lass uns so tun, als hätten alle Spieler ein paar zusätzliche Spiele gegen einen ‚Geister-Gegner' oder gegen sich selbst auf eine sehr ausgewogene Weise gespielt."

Der Artikel schlägt zwei spezifische Wege vor, dies zu tun:

1. Die Methode der „fraktionierten Unentschieden" (Pseudo-Spiele)

Stellen Sie sich vor, dass vor der eigentlichen Saison jedes Paar von Spielern ein winziges, unsichtbares Spiel bestritten hat, das mit einem Unentschieden endete.

  • Wie es funktioniert: Sie fügen jedem Matchup in Ihren Daten ein winziges bisschen „Gutschrift" für einen Sieg und ein winziges bisschen „Gutschrift" für eine Niederlage hinzu.
  • Die Metapher: Es ist, als würde man dem Computer sagen: „Auch wenn Spieler A Spieler B fünfmal besiegt hat, lasst uns so tun, als hätten sie auch einige Spiele bestritten, bei denen sie sich die Differenz geteilt haben."
  • Das Ergebnis: Dies verhindert, dass der Computer sagt: „Spieler A ist unendlich viel besser." Es rückt die Werte näher zusammen und macht die Vorhersage realistischer. Es ist wie das Hinzufügen eines kleinen Maßes an „Zweifel" an die Daten, um die Extreme zu glätten.

2. Die „Geisterspieler"-Methode (Phantom-Spieler)

Stellen Sie sich vor, es gibt einen mysteriösen, unsichtbaren Spieler in der Liga (nennen wir ihn „Mr. Zero"), der genau durchschnittlich ist. Er wird niemals müde, hat nie Glück und sein Skill-Level ist fest auf Null eingestellt.

  • Wie es funktioniert: Sie tun so, als hätte jeder echte Spieler eine ganze Menge Spiele gegen Mr. Zero bestritten. Sie sagen dem Computer, dass jeder Spieler die Hälfte der Zeit gegen Mr. Zero gewonnen und die andere Hälfte verloren hat.
  • Die Metapher: Es ist wie das Verankern eines Bootes. Wenn das Boot (der Score des Spielers) versucht, zu weit abzutreiben (zu hoch oder zu niedrig zu werden), zieht der Anker (Mr. Zero) es zurück in die Mitte.
  • Das Ergebnis: Dies hält die Scores aller Spieler geerdet. Selbst wenn ein Spieler 10 Spiele in Folge gegen schwache Gegner gewinnt, sorgt die Tatsache, dass er die Hälfte seiner Spiele gegen den durchschnittlichen Geisterspieler „verloren" hat, dafür, dass sein Score nicht ins Unendliche schießt.

Warum das cool ist

Der Artikel zeigt, dass diese beiden „falsche Daten"-Tricks genau dieselbe Aufgabe erfüllen wie eine sehr populäre, komplexe mathematische Technik namens „Ridge-Regularisierung" (die normalerweise eine gruselige Formel für Bestrafungen beinhaltet).

  • Der Vorteil: Anstatt zu sagen: „Wir haben eine Strafe von 0,5 auf die Mathematik angewendet", können Sie sagen: „Wir haben 40 gefälschte Spiele gegen einen durchschnittlichen Gegner hinzugefügt."
  • Die Übersetzung: Dies macht die Mathematik für normale Menschen (wie Sportanalysten oder Manager) viel einfacher zu verstehen. Sie können das System anpassen, indem sie einfache Fragen stellen: „Wie viele gefälschte Spiele sollten wir hinzufügen?" oder „Wie sehr sollten wir dem Durchschnittsspieler vertrauen?"

Das Baseball-Beispiel

Der Autor testete dies an der MLB-Saison 2025.

  • Ohne die Korrektur: Da der Spielplan unausgewogen war, schätzte der Computer die Fähigkeiten der besten und schlechtesten Teams als übermäßig optimistisch und übertrieben ein. Die Lücken zwischen den Teams wirkten viel extremer, als sie in Wirklichkeit waren, obwohl die Werte nicht unendlich waren (da jedes Team sowohl Siege als auch Niederlagen hatte).
  • Mit der Korrektur: Der Computer gab den Teams realistischere Scores. Er wusste immer noch, welche Teams gut und welche schlecht waren, aber er übertrieb den Abstand nicht. Die „Geisterspieler"-Methode funktionierte so gut, dass sie Ergebnisse lieferte, die der komplexen „Ridge"-Mathematik fast identisch waren, aber viel einfacher zu erklären waren.

Zusammenfassung

Der Artikel argumentiert, dass man, wenn man Dinge basierend auf Siegen und Niederlagen rankt, diesen Wahnsinn von unendlichen Scores vermeiden kann, indem man so tut, als hätte jeder ein paar zusätzliche, ausgewogene Spiele bestritten.

  • Methode A: Tu so, als hätte jeder ein winziges Unentschieden gegen jeden anderen bestritten.
  • Methode B: Tu so, als hätte jeder eine Menge Spiele gegen einen „durchschnittlichen" Geist bestritten.

Beide Methoden halten die Mathematik einfach, die Vorhersagen realistisch und die Ergebnisse leicht erklärbar für jeden, der nur wissen möchte, wer tatsächlich der Beste ist.

Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?

Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.

Digest testen →