Regularization in Paired Comparison Models via Pseudo-Games and Phantom Players

Este artigo introduz duas estratégias de aumento de dados — pseudo-jogos fracionários e jogadores fantasmas — para fornecer uma regularização intuitiva e interpretável para modelos de comparação pareada, estabilizando efetivamente as estimativas e resolvendo problemas de não-identificabilidade, enquanto replica fielmente os resultados da regularização ridge padrão.

Autores originais: Mark E. Glickman

Publicado 2026-06-03✓ Author reviewed
📖 5 min de leitura🧠 Leitura aprofundada

Autores originais: Mark E. Glickman

Artigo original sob licença CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Esta é uma explicação gerada por IA do artigo abaixo. Não foi escrita pelos autores. Para precisão técnica, consulte o artigo original. Ler aviso legal completo

Imagine que você está tentando classificar um grupo de amigos para saber quem é o melhor em um videogame. Você tem uma lista de quem venceu quem.

Em um mundo perfeito, todos jogariam contra todos um número igual de vezes. Mas, na realidade, alguns jogam muito, outros jogam pouco, e às vezes, um jogador realmente bom pode nunca perder para um oponente específico na pequena amostra de jogos que você observou.

O Problema: A Armadilha da Pontuação "Perfeita"
Se o Jogador A vencer o Jogador B cinco vezes seguidas, um cálculo computacional padrão (chamado de "máxima verossimilhança") concluirá que o Jogador A é infinitamente melhor que o Jogador B. Ele calcula que o Jogador A tem 100% de chance de vencer para sempre.

  • O Problema: Isso é matematicamente "correto" para esses cinco jogos, mas é uma previsão terrível para o futuro. Sabemos que o Jogador B pode vencer na próxima vez. A matemática falha porque trata uma amostra pequena como verdade absoluta, levando a pontuações "infinitas" que não fazem sentido.

A Solução: Adicionando Jogos "Fantasmagóricos"
O autor, Mark Glickman, sugere um truque inteligente para corrigir isso sem usar penalidades matemáticas complexas que são difíceis de explicar. Em vez de mudar a fórmula, ele sugere adicionar dados falsos à mistura. Ele chama isso de "Regularização via Pseudo-Observações".

Pense da seguinte forma: Antes mesmo de olhar os resultados dos jogos reais, você diz ao computador: "Vamos fingir que todos jogaram alguns jogos extras contra um oponente 'Fantasma', ou contra uns aos outros de uma maneira muito equilibrada".

O artigo propõe duas maneiras específicas de fazer isso:

1. O Método do "Empate Fracionário" (Pseudo-Jogos)

Imagine que, antes da temporada real começar, cada par de jogadores jogou um minúsculo jogo invisível onde empataram.

  • Como funciona: Você adiciona um pouco de "crédito" para uma vitória e um pouco de "crédito" para uma derrota a cada confronto em seus dados.
  • A Metáfora: É como dizer ao computador: "Mesmo que o Jogador A tenha vencido o Jogador B cinco vezes, vamos fingir que eles também jogaram alguns jogos onde dividiram os pontos igualmente".
  • O Resultado: Isso impede o computador de dizer "O Jogador A é infinitamente melhor". Isso aproxima as pontuações, tornando a previsão mais realista. É como adicionar um pouco de "dúvida" aos dados para suavizar os extremos.

2. O Método do "Jogador Fantasma" (Jogadores Fantasmas)

Imagine que existe um jogador misterioso e invisível na liga (vamos chamá-lo de "Sr. Zero") que é exatamente mediano. Ele nunca se cansa, nunca tem sorte, e seu nível de habilidade é fixo em zero.

  • Como funciona: Você finge que cada jogador real jogou vários jogos contra o Sr. Zero. Você diz ao computador que cada jogador venceu metade das vezes e perdeu metade das vezes contra o Sr. Zero.
  • A Metáfora: É como ancorar um barco. Se o barco (a pontuação do jogador) tentar derivar demais (tornar-se muito alta ou muito baixa), a âncora (o Sr. Zero) o puxa de volta para o meio.
  • O Resultado: Isso mantém as pontuações de todos fundamentadas. Mesmo que um jogador vença 10 jogos seguidos contra oponentes fracos, o fato de terem "perdido" metade dos jogos contra o Jogador Fantasma médio impede que sua pontuação dispare para o infinito.

Por que isso é legal

O artigo mostra que esses dois truques de "dados falsos" fazem exatamente o mesmo trabalho que uma técnica matemática muito popular e complexa chamada "Regularização Ridge" (que geralmente envolve uma fórmula de penalidade assustadora).

  • O Benefício: Em vez de dizer: "Aplicamos uma penalidade de 0,5 à matemática", você pode dizer: "Adicionamos 40 jogos falsos contra um oponente médio".
  • A Tradução: Isso torna a matemática muito mais fácil de entender para pessoas comuns (como analistas esportivos ou gestores de negócios). Eles podem ajustar o sistema fazendo perguntas simples: "Quantos jogos falsos devemos adicionar?" ou "Quanto devemos confiar no jogador médio?".

O Exemplo do Beisebol

O autor testou isso na temporada de 2025 da Major League Baseball.

  • Sem o ajuste: Como o calendário foi desequilibrado, as estimativas de habilidade dos melhores e piores times saíram excessivamente otimistas e exageradas (as diferenças pareceram muito extremas), embora não tenham chegado a valores literalmente infinitos, já que todos os times tiveram vitórias e derrotas.
  • Com o ajuste: O computador deu aos times pontuações mais razoáveis. Ele ainda sabia que os melhores times eram bons e os piores eram ruins, mas não exagerava a diferença. O método do "Jogador Fantasma" funcionou tão bem que produziu resultados quase idênticos ao complexo método matemático "Ridge", mas foi muito mais fácil de explicar.

Resumo

O artigo argumenta que, ao classificar coisas baseadas em vitórias e derrotas, você pode evitar pontuações loucas e infinitas fingindo que todos jogaram alguns jogos extras e equilibrados.

  • Método A: Fingir que todos jogaram um empate minúsculo contra todos os outros.
  • Método B: Fingir que todos jogaram vários jogos contra um "fantasma" médio.

Ambos os métodos mantêm a matemática simples, as previsões realistas e os resultados fáceis de explicar para qualquer pessoa que só queira saber quem é realmente o melhor.

Afogado em artigos na sua área?

Receba digests diários dos artigos mais recentes que correspondam às suas palavras-chave de pesquisa — com resumos técnicos, no seu idioma.

Experimentar Digest →