Seeing Through Deception: Uncovering Misleading Creator Intent in Multimodal News with Vision-Language Models

该论文提出了名为 DeceptionDecoded 的大规模基准数据集,旨在通过模拟创作者意图来揭示多模态新闻中的误导性叙事,并评估了现有视觉语言模型在意图推理方面的不足,证明了基于该数据集训练的模型能有效提升现实世界多模态虚假信息治理的鲁棒性。

原作者: Jiaying Wu, Fanxiao Li, Zihang Fu, Min-Yen Kan, Bryan Hooi

发布于 2026-04-14
📖 1 分钟阅读☕ 轻松阅读

这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是在给现在的"AI 侦探”们(也就是多模态大模型)做了一次**“防骗特训”**,并揭露了它们在面对高智商诈骗时的弱点。

我们可以把这篇论文的核心内容想象成一场**“新闻界的照妖镜”行动**。

1. 背景:为什么我们需要这面“照妖镜”?

想象一下,你看到一张新闻图片:南极的冰山在融化。

  • 真相(可信新闻):文章说这是自然气候变暖导致的。
  • 骗局(误导性新闻):有人给这张图配了一段文字,说:“这是南极秘密水下核试验导致的!”

虽然图片本身是真的(冰山确实在融化),但配文和背后的意图完全是编造的,目的是制造恐慌,让人怀疑政府或军队。

以前的 AI 检测器主要看“图是不是和文字对不上”(比如图是猫,文字说狗)。但现在的骗子很聪明,他们会让图和文字看起来非常和谐(图是冰山,文字说核试验,逻辑上似乎也能自圆其说),但真正的恶意在于“创作者的意图”——他们就是想吓唬你。

现有的 AI 就像那些只看表面现象的“老实人”,容易被这种“表面和谐”的骗局骗过。

2. 核心发明:DECEPTIONDECODED(骗术解码器)

为了解决这个问题,作者们造了一个巨大的**“诈骗模拟训练场”**,名字叫 DECEPTIONDECODED

  • 它是怎么造的?
    作者们找来了 12,000 条真实的、可信的新闻(作为“底稿”),然后让 AI 扮演两个角色:

    1. 诚实记者:如实报道。
    2. 恶意骗子:根据预设的“作恶计划”(比如想制造政治对立、想让人恐慌),故意修改图片或文字,但保留新闻的外衣。
  • 这个训练场有什么特别?
    以前的数据集只是简单地把图和文乱配。而这个训练场不仅生成了假新闻,还给每个假新闻贴上了“作案动机”的标签

    • 动机 A:我想让公众觉得政府无能(政治极化)。
    • 动机 B:我想让大家觉得某种药有毒(公共卫生恐慌)。
    • 手段:是改图了?还是改字了?是改得特别明显,还是改得很 subtle(微妙)?

这就像给警察(AI 模型)提供了一个**“罪犯心理档案库”,让他们不仅学会识别假新闻,还要学会“读心术”**,推测骗子到底想干什么。

3. 大考结果:AI 侦探们“挂科”了

作者们把当时最厉害的 14 种 AI 模型(比如 GPT-4o, Claude, Gemini 等)拉进这个训练场考试,结果让人大跌眼镜:

  • AI 太“肤浅”了:它们太容易被表面的“光鲜亮丽”骗到。如果一段假新闻写得像官方新闻一样专业、语气很正式,AI 就倾向于相信它是真的。
  • AI 缺乏“读心术”:它们看不出图片里多了一个不该出现的人,或者文字里多了一个暗示性的词背后的恶意
  • AI 容易“被带节奏”:实验发现,如果给 AI 一个提示说“这新闻可能是假的”,它就能查出来;但如果提示说“这新闻很可信”,它立马就信了。这说明 AI 不是在看证据,而是在听指挥,像个没有主见的跟班。

比喻:现在的 AI 就像是一个只看衣服是否整洁的保安。骗子穿了一身笔挺的西装(专业的语气、精美的图片),保安就放行;而真正的坏人可能只是西装里藏了一把刀(恶意的意图),保安却看不见。

4. 解决方案:用“毒”攻“毒”

既然 AI 不会“读心”,作者们就用这个DECEPTIONDECODED 训练场来“特训”AI。

  • 特训过程:把那些带有“作案动机”标签的假新闻喂给 AI 看,强迫它去思考:“这个骗子为什么要这么改图?他想达到什么目的?”
  • 特训效果:经过特训的 AI,不仅在这个训练场上变聪明了,把这种能力迁移到现实世界的其他假新闻检测任务中,效果也大幅提升

比喻:这就像让警察去**“卧底”**,亲自体验骗子的作案手法和心理。一旦警察理解了骗子的思维逻辑,以后在大街上遇到类似的骗子,一眼就能识破。

5. 总结与启示

这篇论文告诉我们:

  1. 光看表面没用:未来的假新闻会越来越逼真,图和文会配合得天衣无缝。
  2. 意图是关键:检测假新闻的核心,不再是找“哪里对不上”,而是要看**“创作者想干什么”**。
  3. AI 还需要进化:现在的 AI 太容易被表面现象和提示词带偏,它们需要学会像人类一样,去理解新闻背后的深层动机

一句话总结
作者们造了一个**“高智商骗术模拟实验室”,发现现在的 AI 太容易被骗子的“专业包装”忽悠,于是通过让 AI 在这个实验室里学习骗子的心理**,成功提升了 AI 识破高难度假新闻的能力,为未来治理网络谣言提供了一把更锋利的“手术刀”。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →