BLM-Guard: Explainable Multimodal Ad Moderation with Chain-of-Thought and Policy-Aligned Rewards

本文提出了 BLM-Guard,一种融合思维链推理、规则驱动政策对齐及多任务架构的可解释多模态广告审核框架,通过规则引导的 ICoT 数据合成与强化学习显著提升了短视频广告在准确性、一致性和泛化性上的审核表现。

Yiran Yang, Zhaowei Liu, Yuan Yuan, Yukun Song, Xiong Ma, Yinghao Song, Xiangji Zeng, Lu Sun, Yulu Wang, Hai Zhou, Shuai Cui, Zhaohan Gong, Jiefei Zhang

发布于 2026-02-24
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇文章介绍了一个名为 BLM-Guard 的“超级审核员”,专门用来给短视频里的商业广告“体检”。

想象一下,现在的短视频平台(像抖音、快手)上,广告多得像天上的星星。以前的审核员主要管“大坏蛋”,比如打打杀杀、裸露画面这些一眼就能看出来的违规内容。但现在的广告很“狡猾”,它们表面看着正常,实际上藏着很多小陷阱

  • 嘴硬心虚:画面里是普通手机,配音却吹牛说“免费领高端机”。
  • 图文不符:字幕写着“健康养生”,画面里却暗示能“一夜暴富”。
  • 夸大其词:把普通茶叶说成能治百病的“神药”。

这些“软性违规”很难用简单的规则(比如“只要出现‘免费’两个字就屏蔽”)来拦截,因为广告商很会钻空子。

BLM-Guard 就是为了解决这个难题而生的“智能侦探”。 我们可以用三个生动的比喻来理解它的核心功能:

1. 它的“大脑”:会写推理日记的侦探 (Chain-of-Thought)

普通的审核系统像个照相机,只负责拍下来,看到违规就报警。
BLM-Guard 则像个福尔摩斯。它不会直接下结论,而是会先写一本“推理日记”(Chain-of-Thought):

  • 第一步(观察):“我看到视频里有人在推销茶叶,字幕写着‘补肾’。”
  • 第二步(分析):“但是,根据平台规定,普通食品不能宣传治疗功效。而且,画面里的茶叶包装看起来很普通,和配音里吹嘘的‘神效’对不上。”
  • 第三步(结论):“所以,这是一个违规广告,属于‘虚假宣传’。”

这种“先思考、后下结论”的方式,让它不仅能告诉你“违规了”,还能告诉你“为什么违规”,就像老师批改作业时的详细评语一样。

2. 它的“训练法”:先背规则书,再实战演练 (SFT + RL)

为了让这个侦探变强,作者给它设计了一套独特的“特训营”:

  • 第一阶段:背规则书 (Rule-Guided SFT)
    就像新警察入职,先给它一本厚厚的《广告法》和《平台审核手册》。它通过阅读成千上万条带有“标准答案”和“推理过程”的案例,学会了如何把视频里的画面、声音和文字对应到具体的规则条款上。这步叫“冷启动”,让它先懂规矩。

  • 第二阶段:实战演练与自我纠错 (Reinforcement Learning)
    光背书本不够,还得实战。系统会给它出一些特别刁钻的题目(比如那些模棱两可的广告)。

    • 如果它答对了,就给它发“小红花”(奖励)。
    • 如果它答错了,或者推理逻辑不通,系统里的“考官”(一个辅助模型)会立刻指出:“你刚才推理说这是‘暴力’,但其实是‘迷信’,你的逻辑链条断了。”
    • 通过这种不断的“试错 - 反馈 - 修正”,它学会了在规则模糊的时候,也能做出最符合平台精神的判断。

3. 它的“超能力”:火眼金睛看穿“障眼法” (Multimodal)

很多广告是“声画分离”的。

  • 普通审核:可能只看画面,觉得“这茶挺绿的,没问题”;或者只听声音,觉得“这词挺好听,没问题”。
  • BLM-Guard:它像是一个同时拥有眼睛和耳朵的侦探。它能发现:画面里是“普通水杯”,声音里却在喊“包治百病”。这种跨模态的矛盾(Cross-modal mismatch),正是它最擅长抓的“把柄”。

总结:它厉害在哪里?

在真实的测试中,BLM-Guard 的表现就像是一个经验丰富、逻辑严密且从不疲劳的金牌审核员

  1. 更准:它比现有的其他 AI 模型更能准确识别那些“擦边球”广告。
  2. 更稳:不管广告怎么变着花样(比如今天用方言,明天用网络梗),它都能稳住阵脚,不轻易被忽悠。
  3. 更透明:它不会冷冰冰地只给一个“封禁”指令,而是会给出详细的理由,让广告主知道哪里错了,也让平台管理者放心。

一句话概括:
BLM-Guard 就是一个读过法律书、受过特训、并且会写详细推理报告的 AI 审核员,它专门负责在短视频的海洋里,把那些披着羊皮、试图钻空子的“坏广告”给揪出来,还大家一个清清爽爽的网络环境。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →