MBD: A Model-Based Debiasing Framework Across User, Content, and Model Dimensions

O artigo propõe o MBD, um framework de desviamento baseado em modelo que transforma sinais comportamentais enviesados em representações calibradas e personalizadas através da modelagem distribucional, permitindo a construção de sinais de valor mais justos e adaptáveis sem exigir infraestrutura de serviço separada.

Yuantong Li, Lei Yuan, Zhihao Zheng, Weimiao Wu, Songbin Liu, Jeong Min Lee, Ali Selman Aydin, Shaofeng Deng, Junbo Chen, Xinyi Zhang, Hongjing Xia, Sam Fieldman, Matthew Kosko, Wei Fu, Du Zhang, Peiyu Yang, Albert Jin Chung, Xianlei Qiu, Miao Yu, Zhongwei Teng, Hao Chen, Sunny Baek, Hui Tang, Yang Lv, Renze Wang, Qifan Wang, Zhan Li, Tiantian Xu, Peng Wu, Ji Liu

Publicado 2026-03-17
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é o diretor de uma grande festa (o aplicativo de vídeos) e precisa decidir quais músicas tocar para que todos os convidados se divirtam. O seu problema é que você tem um assistente (o sistema de recomendação) que tenta adivinhar o que as pessoas gostam, mas esse assistente é um pouco "preguiçoso" e usa regras muito simples que acabam prejudicando a festa.

Aqui está a explicação do papel MBD (Model-Based Debiasing) usando uma analogia simples:

O Problema: O Assistente Cego

O assistente do sistema olha para os dados brutos e diz: "Olha, essa música durou 5 minutos, então as pessoas devem ter gostado muito!" ou "Essa foto foi curtida, então é ótima!".

Mas isso é injusto por três motivos principais:

  1. O Formato Engana: É muito mais fácil alguém assistir a um vídeo de 10 minutos do que a uma foto estática. O assistente acha que o vídeo é melhor só porque durou mais, mesmo que a foto fosse mais divertida.
  2. O Tempo Engana: Vídeos curtos são mais propensos a serem assistidos até o final (loop) do que vídeos longos. O assistente acha que os curtos são melhores.
  3. O Convidado Engana: Algumas pessoas são super ativas e curtem tudo. Outras são tímidas e só curtem o que amam. O assistente trata o "curtir" de um tímido e de um hiperativo da mesma forma, o que não faz sentido.

Isso cria um viés: o sistema começa a mostrar apenas vídeos longos ou fotos, ignorando o que o usuário realmente quer, porque os números brutos estão "mentindo" sobre a qualidade real.

A Solução: O "Sistema de Notas Relativas" (MBD)

O papel propõe o MBD, que é como dar ao assistente um "contexto" ou uma "régua inteligente" para medir as coisas. Em vez de olhar apenas para o número bruto (ex: "5 minutos de visualização"), o MBD pergunta:

"Espera aí! Para um vídeo de 5 minutos, ver 5 minutos é incrível (é 100% do vídeo!). Mas para um vídeo de 10 minutos, ver 5 minutos é apenas metade. Vamos comparar o desempenho deste vídeo com o que é 'normal' para vídeos desse tamanho."

O MBD funciona em três passos simples:

  1. Criar Grupos Inteligentes (Não Caixas Rígidas):
    Antigamente, o sistema tentava agrupar vídeos em caixas rígidas (ex: "vídeos de 5 a 10 segundos"). O problema é que um vídeo de 5,1 segundos era tratado igual a um de 9,9 segundos, o que é errado.
    O MBD é como um professor que não usa caixas, mas sim uma fórmula matemática flexível. Ele olha para o vídeo, para o usuário e para o contexto, e calcula instantaneamente: "Qual é a média de visualização para este tipo de vídeo com este tipo de usuário?".

  2. Calcular a "Média" e a "Variação" (O Contexto):
    O sistema não apenas prevê o número, ele aprende a prever duas coisas ao mesmo tempo:

    • A Média (µ): O que é "normal" esperar?
    • A Variação (σ): Quão imprevisível é esse grupo?
    • Analogia: Imagine que você joga basquete. Se você faz 20 pontos num jogo normal, é ótimo. Mas se você faz 20 pontos num jogo onde a média é 5, você é um astro! O MBD descobre se você é um astro ou apenas um jogador mediano, comparando seu desempenho com a média do seu time.
  3. Transformar em "Pontuação Justa" (Z-Score):
    Em vez de usar o número bruto, o sistema converte tudo em uma pontuação relativa.

    • Antes: "Este vídeo teve 45 segundos de visualização." (Não sabemos se é bom ou ruim).
    • Depois (com MBD): "Este vídeo teve um desempenho no 85º percentil para vídeos desse tamanho!" (Isso significa que ele foi melhor que 85% dos vídeos parecidos).

Por que isso é genial?

  • Não precisa de novas máquinas: O MBD é como um "ramo extra" que cresce dentro da árvore principal do sistema. Ele usa a mesma inteligência artificial que já existe, apenas adicionando uma pequena camada de cálculo. É leve e rápido.
  • Funciona para tudo: Serve para vídeos longos, fotos, vídeos novos (que ninguém viu ainda) e até para usuários de diferentes países.
  • Resultados Reais: Quando o Meta (Facebook, Instagram, etc.) testou isso em bilhões de usuários, a festa ficou melhor. As pessoas passaram mais tempo no aplicativo, assistiram a mais vídeos e interagiram mais, porque o sistema finalmente parou de priorizar o que era "fácil de medir" e passou a priorizar o que as pessoas realmente gostavam.

Resumo em uma frase

O MBD é como um juiz de competição que, em vez de olhar apenas para o tempo total que um atleta correu, olha para o tempo dele comparado ao que é normal para a distância daquela corrida e para as condições do dia, garantindo que o vencedor seja realmente o mais talentoso, e não apenas o que correu a distância mais curta.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →