BLM-Guard: Explainable Multimodal Ad Moderation with Chain-of-Thought and Policy-Aligned Rewards

BLM-Guard is een uitlegbaar multimodaal moderatiesysteem voor reclames dat Chain-of-Thought-redenering combineert met beleidsgerichte beloningen en een regelgestuurde data-synthesepijplijn om valse advertenties op korte video's nauwkeuriger en robuuster te detecteren dan bestaande methoden.

Yiran Yang, Zhaowei Liu, Yuan Yuan, Yukun Song, Xiong Ma, Yinghao Song, Xiangji Zeng, Lu Sun, Yulu Wang, Hai Zhou, Shuai Cui, Zhaohan Gong, Jiefei Zhang

Gepubliceerd 2026-02-24
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een enorme, drukke markt hebt waar iedereen reclame maakt voor hun producten. Soms zijn de verkopers eerlijk, maar soms proberen ze je te bedriegen met opgeblazen beloftes ("Deze telefoon is gratis!"), valse verhalen of zelfs gevaarlijke adviezen.

Vroeger hadden we op deze markt alleen maar politieagenten die heel snel keken: "Is er naakt te zien? Ja? Dan weg." Of "Is er geweld? Ja? Dan weg." Maar in de wereld van korte video's (zoals op TikTok of Instagram) is het veel lastiger. Een verkoper kan een heel normaal gezicht hebben, maar in de tekst beloven dat je in één nacht miljonair wordt. Of ze kunnen zeggen dat een thee je ziekte geneest, terwijl het beeldje gewoon een kopje thee toont.

Dit is waar BLM-Guard voor komt. Het is als een super-intelligente, eerlijke inspecteur die niet alleen kijkt, maar ook denkt en uitlegt.

Hier is hoe het werkt, vertaald naar alledaagse taal:

1. De "Denk-stap" (Chain-of-Thought)

Stel je voor dat een gewone camera alleen zegt: "Ik zie een telefoon."
BLM-Guard doet alsof het een detective is die hardop denkt terwijl hij kijkt:

  • "Oké, ik zie een telefoon op het scherm."
  • "Maar wacht even, de stem zegt: 'Dit is gratis en het beste ter wereld'."
  • "Huh? Dat klopt niet. Niets is gratis. En de tekst in de video zegt iets over 'cheating' (bedriegen)."
  • "Conclusie: Dit is een valstrik. De tekst en het beeld kloppen niet met de regels."

In plaats van alleen een "ja" of "nee" te geven, schrijft deze inspecteur een dossier op waarin hij stap voor stap uitlegt waarom hij iets verbiedt. Zo weten we precies wat er mis is.

2. De "Regelboekjes" (Policy-Aligned Rewards)

Deze inspecteur is niet zomaar een robot; hij heeft een dikke handleiding met alle regels van de markt.

  • Stap 1: Leren van de handleiding. Eerst laten we de robot duizenden voorbeelden zien met de regels ernaast. Hij leert: "Als je 'gratis' zegt maar het kost geld, dan is dat een overtreding." Dit noemen ze Supervised Fine-Tuning. Het is alsof je een stagiair eerst alle regels laat lezen voordat hij aan het werk gaat.
  • Stap 2: Oefenen met feedback. Daarna laten we de robot zelf oefenen. Als hij een fout maakt, krijgt hij een rode kaart (een negatieve score). Als hij het goed doet en zijn uitleg is logisch, krijgt hij een gouden ster (een positieve score).
  • De slimme truc: Soms veranderen de regels (bijvoorbeeld: "Vroeger was 'rijk worden' oké, nu niet meer"). De robot leert om zichzelf te corrigeren. Als hij merkt dat zijn uitleg niet meer past bij de huidige regels, past hij zichzelf aan. Dit heet Reinforcement Learning.

3. De "Oog-oor-coördinatie" (Multimodal)

Een gewone robot kijkt misschien alleen naar de tekst of alleen naar het plaatje. BLM-Guard is als een mens die alle zintuigen gebruikt:

  • Hij kijkt naar het beeld (een glimlachend gezicht).
  • Hij luistert naar de stem (die dreigende toon).
  • Hij leest de ondertiteling (die beloftes doet).
  • En dan vraagt hij zich af: "Klopt dit verhaal wel?" Als de stem zegt "Dit is gezond" maar de tekst zegt "Dit bevat gif", dan vangt hij die tegenstrijdigheid direct op.

Waarom is dit belangrijk?

Vroeger waren de filters ofwel te streng (ze blokkeerden alles) of te slap (ze lieten alles door). BLM-Guard is als een slimme, eerlijke bouncer bij een club:

  1. Hij ziet subtiele trucjes die anderen missen.
  2. Hij kan uitleggen waarom iemand de deur uit wordt gezet (niet zomaar "weg!", maar "omdat je belooft dat je gratis geld krijgt, wat niet mag").
  3. Hij past zich snel aan als de regels van de club veranderen.

Kortom: BLM-Guard is een slimme tool die korte video-reclames controleert door te kijken, te luisteren, te lezen en vooral te denken, zodat we een veilige en eerlijke markt houden voor iedereen.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →