Regularization in Paired Comparison Models via Pseudo-Games and Phantom Players

本文引入了两种数据增强策略——分数伪博弈(fractional pseudo-games)和幻影玩家(phantom players),旨在为成对比较模型提供直观且具解释性的正则化,从而在有效稳定估计值并解决不可识别问题的同时,能够紧密复现标准岭正则化的结果。

原作者: Mark E. Glickman

发布于 2026-06-03✓ Author reviewed
📖 1 分钟阅读☕ 轻松阅读

原作者: Mark E. Glickman

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,你正试图根据胜负情况对一群朋友进行排名,以确定谁才是这款视频游戏中的高手。你手里有一份关于“谁击败了谁”的名单。

在理想的世界里,每个人与其他人的对局次数应该是相等的。但在现实中,有些人玩了很多场,有些人玩得很少,而且有时,一个非常厉害的玩家在你看过的少量样本中,可能从未输给过某个特定的对手。

问题所在:“完美”分数的陷阱
如果玩家 A 连续五次击败玩家 B,标准的计算机计算方法(称为“极大似然估计”)会得出结论:玩家 A 比玩家 B 高明无数倍。它计算出玩家 A 永远有 100% 的胜率。

  • 问题在于: 对于这五场比赛来说,这在数学上是“正确”的,但对于未来的预测,这是一个糟糕的判断。我们知道玩家 B 下次可能会赢。这种数学方法之所以失效,是因为它将微小的样本量视为绝对真理,导致产生了毫无意义的“无穷大”分数。

解决方案:添加“幽灵”比赛
作者马克·格里克曼(Mark Glickman)提出了一个聪明的技巧来解决这个问题,而不需要使用难以解释的复杂数学惩罚项。他并没有改变公式,而是建议添加虚假数据。他称之为“通过伪观测值进行正则化”。

你可以这样理解:在观察真实的比赛结果之前,你先告诉计算机,“让我们假装每个人都与一个‘幽灵’对手或以一种非常平衡的方式进行了几场额外的比赛。”

该论文提出了两种具体的实现方式:

1. “分数平局”法(伪比赛)

想象一下,在正式赛季开始前,每一对玩家都进行了一场微小的、隐形的比赛,结果是平局。

  • 运作方式: 你在数据中的每一次对决中,都加入了一点“获胜”的信用和一点点“失败”的信用。
  • 比喻: 这就像是在告诉计算机:“即便玩家 A 击败了玩家 B 五次,我们也假装他们也进行了一些平分秋平的比赛。”
  • 结果: 这阻止了计算机说“玩家 A 强到无限大”。它将分数拉近,使预测更加符合现实。这就像是在数据中加入了一点“怀疑”,从而平滑了极端值。

2. “幽灵玩家”法(幻影玩家)

想象联赛中有一个神秘的、隐形的玩家(我们叫他“零先生”),他的水平恰好处于平均水平。他从不疲劳,也不靠运气,且其技能等级固定为零。

  • 运作方式: 你假装每个真实玩家都与“零先生”打了很多场比赛。你告诉计算机,每个玩家在面对“零先生”时,胜场和败场各占一半。
  • 比喻: 这就像是在锚定一艘船。如果船(玩家的分数)试图漂得太远(变得过高或过低),锚(零先生)就会把它拉回中间。
  • 结果: 这让所有人的分数都保持在合理的范围内。即使一个玩家在面对弱对手时连赢了 10 场,由于他在面对平均水平的“幽灵玩家”时“输掉”了一半的比赛,他的分数也不会飙升至无穷大。

为什么这很酷

论文表明,这两个“虚假数据”的小技巧,实际上完成了与一种非常流行的复杂数学技术——“岭正则化”(通常涉及看起来很吓人的惩罚公式)完全相同的工作。

  • 优势: 与其说“我们对数学应用了 0.5 的惩罚”,你不如说“我们添加了 40 场针对平均水平对手的虚假比赛”。
  • 转化: 这使得数学变得更容易被普通人(如体育分析师或业务经理)理解。他们可以通过询问简单的逻辑来调整系统:“我们应该添加多少场虚假比赛?”或者“我们应该对平均水平的玩家给予多少信任?”

棒球案例

作者在 2025 年美国职业棒球大联盟(MLB)赛季中测试了这一点。

  • 没有修复时: 由于赛程安排的不平衡,计算机估算出的最强球队和最弱球队的能力值显得过于乐观且被夸大了(差距看起来过大),尽管它们并非字面意义上的“无限”。
  • 有了修复后: 计算机给了各队更合理的评分。它仍然知道强队很强,弱队很弱,但它没有夸大其中的差距。“幽灵玩家”法的表现非常好,它产生的结果与复杂的“岭”数学方法几乎完全一致,但后者要难解释得多。

总结

论文指出,在根据胜负进行排名时,你可以通过假装每个人都进行了一些额外的、平衡的比赛,来避免出现疯狂的、无穷大的分数。

  • 方法 A: 假装每个人都与其他人进行了一场微小的平局。
  • 方法 B: 假装每个人都与一个“平均水平”的幽灵打了很多场比赛。

这两种方法都能让数学保持简单、预测保持现实,并且让结果易于向任何只想知道谁才是真正高手的人进行解释。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →