BLM-Guard: Explainable Multimodal Ad Moderation with Chain-of-Thought and Policy-Aligned Rewards

Le papier présente BLM-Guard, un cadre de modération multimodale explicable pour les publicités vidéo courtes qui combine un raisonnement de type « Chain-of-Thought », des principes de politique guidés par des règles et un apprentissage par renforcement pour améliorer la précision et la robustesse dans la détection de contenus trompeurs.

Yiran Yang, Zhaowei Liu, Yuan Yuan, Yukun Song, Xiong Ma, Yinghao Song, Xiangji Zeng, Lu Sun, Yulu Wang, Hai Zhou, Shuai Cui, Zhaohan Gong, Jiefei Zhang

Publié 2026-02-24
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

Imaginez que les réseaux sociaux de vidéos courtes (comme TikTok ou les Reels) sont devenus d'immenses places de marché animées. Tout le monde y vend quelque chose : des téléphones, des thés, des cours, etc. Le problème ? Certains vendeurs sont malhonnêtes. Ils utilisent des images trompeuses, des promesses impossibles ("gagnez 1 million en une nuit !") ou des discours qui contredisent ce qu'on voit à l'écran.

Traditionnellement, les gardiens de ces places de marché (les modérateurs) utilisaient soit des règles rigides (comme un portier qui vérifie une liste noire), soit des robots très intelligents mais un peu "bavards" qui ne comprennent pas toujours les nuances.

BLM-Guard, c'est le nouveau gardien de sécurité proposé par les chercheurs de Kuaishou. Voici comment il fonctionne, expliqué simplement avec des images :

1. Le Problème : Le Vendeur Astucieux

Les publicités modernes sont complexes. Une vidéo peut montrer un téléphone magnifique (visuel) mais la voix off (audio) peut dire "c'est gratuit" alors que le texte en bas dit "payez maintenant".

  • L'ancien gardien (les filtres classiques) : Il voit le téléphone, il ne voit pas le mensonge dans la voix. Il laisse passer.
  • Le robot générique : Il voit tout, mais il ne sait pas pourquoi c'est interdit selon les règles spécifiques de la plateforme. Il est trop généraliste.

2. La Solution : BLM-Guard, le Détective Formé

BLM-Guard n'est pas juste un robot qui regarde ; c'est un détective qui réfléchit avant de juger. Il utilise trois super-pouvoirs :

A. La "Chaîne de Pensée" (Le Carnet de Notes du Détective)

Au lieu de dire simplement "C'est interdit", BLM-Guard écrit son enquête étape par étape, comme un détective dans un roman policier :

  1. Observation : "Je vois un téléphone dans la main du vendeur."
  2. Analyse : "La voix dit 'C'est gratuit', mais le texte dit '5000 yuans'."
  3. Déduction : "Il y a un mensonge entre ce qu'on entend et ce qu'on lit."
  4. Verdict : "C'est une publicité trompeuse."

Cette méthode permet de comprendre le pourquoi d'une décision, pas juste le résultat.

B. L'Entraînement par les Règles (Le Manuel de l'Inspecteur)

Avant de laisser le détective travailler seul, on lui donne un manuel de formation très strict.

  • L'analogie : Imaginez un apprenti policier qui doit apprendre le code de la route par cœur avant de prendre la route.
  • Comment ça marche : Les chercheurs ont créé des milliers d'exemples de publicités (réelles ou simulées) et ont écrit pour chacune la "bonne" explication. Le robot apprend à associer une image à une règle précise (ex: "Si on promet un gain facile sans effort, c'est interdit"). Cela lui évite de faire des erreurs au début.

C. L'Entraînement par Récompense (Le Coach Sportif)

Une fois que le détective a lu le manuel, il commence à travailler, mais il a un coach qui le corrige en temps réel.

  • Le système de points : Si le robot trouve la bonne infraction et explique bien pourquoi, il gagne des points. S'il se trompe ou si son explication est floue, il perd des points.
  • L'adaptation : Les règles changent souvent (ce qui était toléré hier ne l'est plus aujourd'hui). BLM-Guard s'adapte dynamiquement. Si le coach lui dit "Attention, la règle sur les promesses de santé a changé", le robot ajuste sa stratégie immédiatement pour rester aligné avec la nouvelle politique.

3. Le Résultat : Un Gardien Infaillible

Grâce à cette méthode, BLM-Guard est devenu bien meilleur que ses concurrents :

  • Il ne rate rien : Il détecte les mensonges subtils (comme un texte qui contredit la voix).
  • Il est juste : Il ne bloque pas les publicités honnêtes par erreur.
  • Il s'explique : Si on lui demande pourquoi il a bloqué une vidéo, il peut vous dire exactement quelle règle a été enfreinte et où se trouve le problème.

En Résumé

Imaginez que vous avez un inspecteur de police (BLM-Guard) qui a lu tout le code pénal (les règles), qui tient un carnet de notes détaillé (la chaîne de pensée) pour expliquer ses décisions, et qui est entraîné par un coach qui le félicite quand il a raison et le corrige quand il se trompe.

C'est exactement ce que fait ce système pour nettoyer les publicités sur les réseaux sociaux : il rend la place de marché plus sûre, plus honnête et plus transparente pour tout le monde.

Recevez des articles comme celui-ci dans votre boîte mail

Digests quotidiens ou hebdomadaires personnalisés selon vos intérêts. Résumés Gist ou techniques, dans votre langue.

Essayer Digest →