Sequentially-Rerandomized Switchback Experiments

Este artigo propõe os Experimentos de Alternância Rerandomizados Sequencialmente (SRSB), um novo desenho experimental que melhora a precisão e a robustez na avaliação de políticas em plataformas online ao re-randomizar tratamentos em cada período para garantir o equilíbrio de variáveis prognósticas e lidar com heterogeneidade, não estacionariedade e efeitos de carryover.

Zhenghao Zeng, Christopher Adjaho, Alonso Bucarey, Chao Qin, Ruixuan Zhang, Paul Hoban, Ramesh Johari, Stefan Wager

Publicado 2026-04-06
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é o gerente de uma grande rede de restaurantes e quer testar uma nova receita de hambúrguer para ver se ela vende mais. O problema é que você não pode testar a receita em todos os restaurantes ao mesmo tempo, nem pode mudar a receita de um único restaurante todos os dias, porque os clientes podem estranhar ou o efeito da receita pode durar vários dias (o cliente prova hoje e volta amanhã).

Aqui entra o conceito do Switchback (o "vai e volta"): você divide a cidade em bairros (unidades operacionais). Na segunda-feira, o Bairro A usa a receita nova e o Bairro B usa a antiga. Na terça-feira, você inverte: Bairro B usa a nova e Bairro A usa a antiga. E assim por diante.

O problema é que os bairros são diferentes. O Bairro A pode ser muito rico e o Bairro B, muito pobre. Se na segunda-feira o Bairro A (rico) testar a receita nova, ele vai vender muito, mas será porque é rico, não porque a receita é boa. Se na terça-feira o Bairro B (pobre) testar, venderá pouco. Isso cria um "ruído" que atrapalha a análise.

Agora, imagine que você tem um assistente superinteligente (o algoritmo do artigo) que faz algo chamado SRSB (Experimentos de Switchback Realeatorizados Sequencialmente).

A Analogia do "Casamento Perfeito"

Pense no experimento como tentar encontrar o par perfeito para uma dança.

  1. O Problema do Método Antigo (Randomização Completa):
    Imagine que você sorteia aleatoriamente quem dança com quem a cada música. Às vezes, por sorte, você coloca dois dançarinos experientes juntos. Às vezes, coloca dois iniciantes. Às vezes, coloca um experiente com um iniciante.

    • Resultado: Você não sabe se a dança ficou boa porque o par era bom ou porque a música era boa. A "variância" (o erro) é alta.
  2. A Solução do SRSB (Realeatorização Sequencial):
    O assistente SRSB olha para o que aconteceu antes. Ele sabe que o Bairro A teve um dia de chuva na semana passada (o que afetou as vendas) e que o Bairro B teve um feriado.
    Antes de decidir quem testa a receita nova hoje, o assistente diz: "Espera aí! Se eu colocar o Bairro A na receita nova hoje, ele vai vender muito só por causa do feriado de ontem. Isso não é justo. Vamos tentar outra combinação."
    Ele joga o sorteio de novo e de novo, até encontrar um par onde as condições passadas (chuva, feriado, histórico de vendas) estejam equilibradas entre os dois grupos.

    A Metáfora da Balança:
    Pense em uma balança de dois pratos.

    • Sem SRSB: Você coloca os ingredientes aleatoriamente. Um prato fica pesado demais com "chuva" e o outro com "feriado". A balança pende para um lado, e você não sabe se o peso é da receita ou do ingrediente extra.
    • Com SRSB: O assistente coloca os ingredientes, olha a balança e diz: "Ops, o prato da esquerda está muito pesado com 'histórico de vendas'". Ele tira um pouco de lá e coloca ali, ou troca os ingredientes inteiros, até que a balança fique perfeitamente nivelada antes de começar a pesar a receita nova.

Por que isso é genial?

O artigo mostra que, ao fazer esse "ajuste fino" a cada passo (a cada dia ou semana), você elimina o ruído.

  • Sem carryover (efeito de arrasto): Se a receita nova só afeta o dia de hoje, o SRSB garante que o grupo de teste e o grupo de controle sejam "gêmeos" em termos de histórico. Assim, qualquer diferença de vendas hoje é quase certeza de ser culpa da receita, não do passado.
  • Com carryover (efeito de arrasto): Às vezes, a receita de ontem afeta as vendas de hoje. Se você mudou a receita no Bairro A ontem, ele pode vender bem hoje mesmo com a receita antiga.
    • O Truque do "Bloqueio": Para lidar com isso, o SRSB cria "grupos de permanência". Ele garante que, se um bairro usou a receita antiga ontem, ele tenha a mesma chance de usar a receita antiga ou a nova hoje, mas dentro de um grupo controlado. É como se ele dissesse: "Vamos garantir que os bairros que usaram a receita antiga ontem estejam equilibrados entre si, e os que usaram a nova também." Isso cria grupos estáveis e comparáveis, evitando que o "fantasma" do dia anterior estrague a conta.

O Resumo em Português

Em termos simples, este artigo propõe um método para testar novas ideias em grandes plataformas (como Uber, Airbnb ou redes de varejo) que é muito mais inteligente do que o sorteio aleatório comum.

  1. Não é apenas sorteio: Em vez de apenas jogar uma moeda para decidir quem testa o que, o sistema olha para o passado (vendas de ontem, clima, etc.).
  2. É um "ajuste contínuo": Se o sorteio inicial criar um desequilíbrio (ex: um grupo muito rico vs. um grupo muito pobre), o sistema descarta esse sorteio e joga de novo, até encontrar um equilíbrio perfeito.
  3. Resultado: Você precisa de menos dados para ter certeza do resultado. O "ruído" é eliminado, e você descobre se a nova política funciona de verdade, sem ser enganado por diferenças entre os grupos ou por efeitos que duram mais de um dia.

É como se, em vez de tentar adivinhar se um remédio funciona jogando uma moeda, você garantisse que o grupo de teste e o grupo de controle tivessem exatamente a mesma idade, peso e histórico de saúde antes de dar o remédio. O artigo prova matematicamente que essa "perfeição" no equilíbrio leva a conclusões muito mais rápidas e precisas.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →