Sequentially-Rerandomized Switchback Experiments

Ce papier propose les expériences de commutation réassignées séquentiellement (SRSB), une nouvelle méthode d'expérimentation conçue pour améliorer la précision et la fiabilité des tests A/B sur les plateformes en ligne en rééquilibrant dynamiquement les traitements à chaque période sur la base de variables pronostiques, tout en gérant l'hétérogénéité, la non-stationnarité et les effets de report.

Zhenghao Zeng, Christopher Adjaho, Alonso Bucarey, Chao Qin, Ruixuan Zhang, Paul Hoban, Ramesh Johari, Stefan Wager

Publié 2026-04-06
📖 6 min de lecture🧠 Analyse approfondie

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous êtes le directeur d'une chaîne de restaurants (ou d'une application comme Airbnb ou Uber) et que vous voulez tester une nouvelle recette de burger ou un nouveau système de livraison pour voir si cela augmente les ventes.

Le Problème : Le "Test A/B" classique est parfois trop brouillon

Habituellement, pour tester une idée, on fait un Test A/B : on donne la nouvelle recette à la moitié des restaurants (Groupe A) et on garde l'ancienne à l'autre moitié (Groupe B), puis on compare les résultats.

Mais dans le monde réel, c'est compliqué pour trois raisons :

  1. Peu de restaurants : Vous n'avez peut-être que 50 restaurants, pas des millions. C'est trop peu pour que les statistiques classiques fonctionnent bien.
  2. Des différences énormes : Un restaurant à Paris (très fréquenté) n'est pas comparable à un petit village en Bretagne. Si par malchance, vous mettez tous les restaurants de Paris dans le groupe "Nouvelle Recette", vous aurez l'impression que ça marche super bien, alors que c'est juste parce qu'ils sont déjà populaires.
  3. Le temps joue des tours : Les choses changent. Il y a des tendances saisonnières (plus de ventes en été) et des effets de "retard" (si vous changez la recette aujourd'hui, les clients peuvent mettre une semaine à s'habituer ou à détester le nouveau goût).

Si vous faites un test classique, vous risquez de conclure que votre nouvelle recette est géniale alors qu'elle est nulle, simplement parce que vous avez eu de la "malchance" dans la répartition des restaurants.

La Solution : Le "SRSB" (La méthode du Chef Intuitif)

Les auteurs proposent une nouvelle méthode appelée SRSB. Imaginez que vous ne faites pas un seul grand test, mais que vous ajustez votre stratégie chaque semaine.

Voici comment ça marche, avec une analogie de course de relais :

1. La Commutation (Switchback)

Au lieu de donner la nouvelle recette à un restaurant pour toujours, vous faites alterner les restaurants chaque semaine.

  • Semaine 1 : Restaurant A essaie la nouvelle recette, Restaurant B garde l'ancienne.
  • Semaine 2 : On inverse ! Restaurant A reprend l'ancienne, Restaurant B essaie la nouvelle.
    Cela permet de comparer les deux versions dans le même contexte temporel.

2. La Ré-randomisation Séquentielle (Le cœur de la méthode)

C'est ici que la magie opère. Dans un test classique, on lance une pièce pour décider qui fait quoi chaque semaine. C'est du hasard pur.

Dans la méthode SRSB, on ne se fie pas au hasard aveugle. À chaque semaine, avant de décider qui fait quoi, on regarde ce qui s'est passé la semaine dernière.

  • L'analogie : Imaginez que vous êtes un entraîneur de course. Vous avez deux coureurs, Pierre et Paul. La semaine dernière, Pierre a couru très vite (peut-être qu'il avait juste eu une bonne journée). Cette semaine, si vous voulez tester un nouveau type de chaussures, vous ne voulez pas que Pierre ait les nouvelles chaussures et qu'il soit déjà en forme.
  • La méthode SRSB dit : "Attends, regardons les performances de la semaine dernière. Si Pierre a déjà eu une très bonne semaine, on va lui donner l'ancienne chaussure cette semaine pour équilibrer. On va faire plusieurs tirages au sort (ré-randomisation) jusqu'à ce que l'équipe A et l'équipe B soient parfaitement équilibrées par rapport à leur historique."

On utilise des variables "prédictives" (comme les ventes de la semaine dernière ou la météo) pour s'assurer que les deux groupes sont justes l'un par rapport à l'autre avant même de commencer le test.

Pourquoi c'est génial ?

  • Moins de bruit, plus de signal : En forçant l'équilibre, on élimine le "bruit" (les différences dues au hasard ou à l'historique). On voit beaucoup plus clairement si la nouvelle recette fonctionne vraiment.
  • Adaptabilité : La méthode s'adapte à la réalité. Si les ventes montent en flèche à cause d'un événement imprévu, la méthode le détecte et rééquilibre les groupes pour ne pas fausser le résultat.

Le Cas Spécial : L'Effet de "Rétention" (Carryover)

Parfois, un changement a un effet qui dure plus d'une semaine.

  • Analogie : Si vous changez la musique dans un restaurant, les clients peuvent mettre 2 jours à s'habituer. Si vous changez la musique chaque jour, ils ne savent jamais à quoi s'attendre.

Pour gérer cela, les auteurs proposent une version "Bloquée" du SRSB.

  • Au lieu de mélanger tout le monde, on regarde qui a eu la nouvelle recette la semaine dernière.
  • On crée deux groupes : ceux qui ont eu la nouvelle recette la semaine dernière et ceux qui ont eu l'ancienne.
  • À l'intérieur de chaque groupe, on rééquilibre soigneusement qui garde la même chose ("Stay") et qui change.
  • Cela permet de comparer des situations stables : "Ceux qui ont eu la nouvelle recette deux semaines de suite" vs "Ceux qui ont eu l'ancienne deux semaines de suite". Cela permet de mesurer l'effet réel sans être perturbé par le changement constant.

En Résumé

Imaginez que vous essayez de deviner si un nouveau filtre à café améliore le goût.

  • Méthode classique : Vous essayez le filtre sur 50 cafés au hasard. Si les 50 meilleurs cafés tombent dans le groupe "Nouveau Filtre", vous pensez que le filtre est magique, alors que c'est juste la qualité des grains.
  • Méthode SRSB : Chaque semaine, vous regardez la qualité des grains de la semaine dernière. Vous réorganisez les cafés (en faisant plusieurs tirages au sort) pour vous assurer que le groupe "Nouveau Filtre" et le groupe "Vieux Filtre" ont exactement la même qualité de grains moyenne. Ainsi, si vous voyez une différence de goût, vous êtes sûr à 100% que c'est grâce au filtre, pas à cause des grains.

Le résultat ? Cette méthode permet aux grandes entreprises (comme Airbnb, Uber, etc.) de prendre de meilleures décisions, plus vite et avec moins de risques d'erreur, même quand elles ont peu de données ou un environnement très changeant.

Recevez des articles comme celui-ci dans votre boîte mail

Digests quotidiens ou hebdomadaires personnalisés selon vos intérêts. Résumés Gist ou techniques, dans votre langue.

Essayer Digest →