A Difference-in-Difference Approach to Detecting AI-Generated Images

针对现有基于重构误差的 AI 生成图像检测方法在扩散模型图像日益逼真时效果下降的问题,本文提出了一种利用重构误差差异(二阶差分)进行方差缩减的新方法,显著提升了检测的泛化能力与准确性。

Xinyi Qi, Kai Ye, Chengchun Shi, Ying Yang, Hongyi Zhou, Jin Zhu

发布于 2026-03-02
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文提出了一种名为**“双重差分法”(Difference-in-Difference, DID)**的新方法,用来识别由人工智能(AI)生成的图片。

为了让你轻松理解,我们可以把这件事想象成**“辨别真假古董”或者“寻找完美的赝品”**。

1. 背景:AI 画得越来越像真的了

以前,AI 画的画(比如猫、风景)很容易看出来,因为线条很怪、颜色不对。这时候,只要用放大镜(现有的检测器)看一眼,就能发现破绽。

现在的 AI(特别是扩散模型)太厉害了,它画的画几乎和真的一模一样。这时候,普通的“放大镜”就失效了,因为真画和假画看起来几乎没区别。

2. 旧方法:只测“第一次还原”的误差

以前的检测器是这样工作的:

  • 原理:它手里有一个“还原器”(比如一个 AI 模型)。
  • 操作:把一张图丢进去,让 AI 试着“重新画”一遍。
  • 判断
    • 如果是假画(AI 生成的),它本来就在这个“还原器”的脑子里,所以还原出来的图跟原图几乎一样,误差很小
    • 如果是真画(人拍的),它不在 AI 的脑子里,还原出来的图就会变得很奇怪,误差很大
  • 问题:现在的 AI 太聪明了,连真画它也能还原得挺像。这时候,“假画”和“真画”的误差都变得很小,分不出来了。就像两个双胞胎站在一起,你只看他们的外貌(一阶误差),根本分不清谁是谁。

3. 新方法:DID(双重差分法)——“再测一次,找不同”

这篇论文的作者想了一个绝妙的主意:既然直接看“误差”分不出来,那我们就看“误差的变化”。

这就好比**“照镜子”的比喻**:

  • 第一步(第一次还原)
    你把一张图(xx)给 AI 看,AI 画了一张新图(xx')。

    • 计算它们之间的差距(误差 1)。
    • 现状:现在的 AI 太牛了,真图和假图产生的“误差 1"都很小,很难区分。
  • 第二步(第二次还原,关键!)
    别停!把刚才 AI 画的那张新图(xx'),丢给同一个 AI,让它再画一次(得到 xx'')。

    • 计算 xx'xx'' 之间的差距(误差 2)。
  • 第三步(双重差分):做减法
    现在,我们比较一下**“误差 1"“误差 2"**。

    • 对于假画(AI 生成的)
      它本来就是 AI 画出来的,所以它很“顺从”。
      第一次还原,它变了一点点(误差 1 很小)。
      第二次还原,它又变了一点点(误差 2 也很小)。
      关键点:这两次变化非常相似,就像两个双胞胎走路的姿势几乎一样。当你把这两个误差相减时,它们互相抵消了,结果接近于 0
    • 对于真画(人拍的)
      它本来就不属于 AI 的世界。
      第一次还原,AI 强行把它“掰”成自己熟悉的形状(误差 1 里包含了很多强行修改的痕迹)。
      第二次还原,AI 对着这个“被掰过的形状”再改一次,这次它发现“咦,这个形状有点奇怪”,于是又产生了一些新的、不一样的扭曲(误差 2)。
      关键点:这两次变化的“姿势”不一样。当你把这两个误差相减时,它们无法抵消,剩下的那个“差值”就暴露了真画的身份。

4. 核心比喻:噪音 vs. 信号

  • 旧方法像是在嘈杂的房间里听人说话。现在的 AI 太完美了,背景噪音(AI 生成过程中的随机抖动)太大,把真正的信号(真假的差异)给淹没了。
  • DID 方法像是**“降噪耳机”**。
    • 第一次听,有噪音。
    • 第二次听,噪音还是那个噪音(因为 AI 的随机性在两次操作中是相似的)。
    • 当你把两次听到的声音相减噪音就被抵消掉了,只剩下那个独特的、无法被抵消的“真话”(真画与假画本质上的微小差异)。

5. 总结

这篇论文的核心思想就是:不要只看一次结果,要看两次结果的“变化量”。

  • 假画:两次还原都很顺滑,变化量互相抵消,“双重差分”后几乎没动静
  • 真画:两次还原都很别扭,变化量互相冲突,“双重差分”后留下了明显的痕迹

作者通过大量实验证明,即使面对目前最顶尖的 AI 绘画工具,这种方法也能像“照妖镜”一样,精准地把它们从真画中揪出来,准确率比以前的方法提高了 20% 到 30%。

一句话总结
以前的检测器是“看谁长得像”,现在的 DID 检测器是“看谁在模仿时动作更不自然”。即使 AI 画得再像,它在“自我复制”时的微小不自然,也逃不过双重差分的火眼金睛。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →