Tracing Copied Pixels and Regularizing Patch Affinity in Copy Detection

该论文提出了一种结合显式像素坐标追踪模块(PixTrace)与几何引导对比损失(CopyNCE)的新方法,通过利用编辑内容的几何可追溯性来增强细粒度对应学习,从而在自监督图像复制检测任务中实现了超越现有技术的性能与可解释性。

Yichen Lu, Siwei Nie, Minlong Lu, Xudong Yang, Xiaobo Zhang, Peng Zhang

发布于 2026-02-26
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲的是如何更聪明地**“抓图片抄袭”**。

想象一下,你有一张原创的精美照片(比如一只松鼠),然后有人把它拿去“整容”了:可能把背景换了、把松鼠旋转了、把颜色调暗了,甚至把松鼠的眼睛抠出来贴到了另一只动物身上。现在的任务是:你要从成千上万张照片里,一眼认出哪张是那只“整容”后的松鼠。

以前的方法就像是一个**“模糊的侦探”**。它只看大概的感觉(比如“这好像也是只松鼠”),或者靠猜(“这两个地方看起来有点像”)。如果抄袭者把图片改得稍微复杂一点,这个侦探就晕了,容易把不是抄袭的当成抄袭,或者漏掉真正的抄袭。

这篇论文提出了两个新招数,让侦探变成了**“拥有上帝视角的 forensic 专家”**。

核心故事:像素的“身份证”追踪系统

1. 第一招:PixTrace(像素追踪器)—— 给每个像素发“护照”

以前的方法在比较两张图时,是瞎猜的。比如,它觉得图 A 的左上角和图 B 的右下角很像,就强行把它们配对。但这经常出错。

这篇论文说:“别猜了,我们直接看‘身份证’!”

  • 比喻:想象你的原图是一张巨大的地图,上面的每一个像素点(比如松鼠眼睛上的一个红点)都有一个唯一的坐标(经度、纬度)。
  • 操作:当有人对图片进行“整容”(比如旋转、缩放、抠图)时,这个系统(PixTrace)就像是一个超级记账员。它手里拿着一本账本(坐标表),记录着:“原本在 (10, 10) 的那个像素点,经过旋转后,现在跑到了 (20, 20)。”
  • 效果:不管图片被怎么折腾,我们都能精确地知道:“现在的这个像素,就是原来那个像素变的。” 这就像给每个像素都发了护照,无论它怎么变形,都能查出来它原本是谁。

2. 第二招:CopyNCE(几何对齐的“相亲”规则)—— 教 AI 怎么“谈恋爱”

有了上面的“护照”信息,我们怎么教 AI 去识别抄袭呢?

以前的 AI 训练就像是在玩“找不同”,但规则很乱。它可能会把两个其实没关系的地方强行说成是一对(假阳性),或者漏掉真正有关系的地方(假阴性)。

这篇论文提出了一个新的训练规则(CopyNCE):

  • 比喻:想象你在教 AI 玩“连连看”。
    • 旧规则:只要两个方块颜色差不多,就说是连着的。结果 AI 经常连错。
    • 新规则(CopyNCE):利用刚才那个“记账员”的数据。
      • 如果像素 A 来自原图的松鼠眼睛,像素 B 来自修改后的松鼠眼睛。
      • 记账员告诉我们:“这两个像素是‘亲兄弟’,它们重叠的面积是 50%。”
      • 于是,AI 的训练规则变成了:“如果两个区域重叠面积大,你们就要紧紧抱在一起(相似度极高);如果重叠面积小,你们就要离得远一点。”
  • 效果:这就像给 AI 提供了一个**“标准答案”。它不再瞎猜,而是根据精确的几何重叠比例来学习。这让 AI 学会了:“哦,原来真正的抄袭,是那些‘虽然变形了,但核心部分还能对得上’的东西。”**

为什么这很厉害?

  1. 更准(SOTA 性能)
    在著名的“图片相似度挑战赛”(DISC21)中,这套方法拿到了第一名

    • 匹配器(Matcher):就像是一个拿着放大镜的侦探,直接对比两张图,准确率高达 88.7%
    • 描述器(Descriptor):就像是一个给图片打标签的档案员,准确率也达到了 72.6%
    • 这比以前的所有方法都要好,尤其是面对那些复杂的、经过多次“整容”的图片时。
  2. 更懂行(可解释性)
    以前的 AI 像个黑盒子,告诉你“这是抄袭”,但不知道为啥。
    现在的 AI 能画出**“热力图”**。如果你把鼠标移到松鼠的眼睛上,AI 能清晰地告诉你:“看!这张图的眼睛和那张图的眼睛,像素点是一一对应的!”这让结果非常透明,让人信服。

  3. 更抗揍(鲁棒性)
    即使图片被旋转、拉伸、甚至把背景全换了,只要核心的像素“身份证”还在,这套系统就能把原图和改图连起来。

总结

这篇论文的核心思想就是:不要只靠“感觉”去抓抄袭,要靠“数学”和“轨迹”去抓。

  • PixTrace 是那个**“记账员”**,它精确记录了每个像素从原图到改图的旅行路线。
  • CopyNCE 是那个**“严师”**,它利用记账员的数据,强迫 AI 学习正确的“连连看”规则,而不是瞎蒙。

这套组合拳,让 AI 在识别图片抄袭这件事上,从“大概齐”进化到了“精准打击”的水平。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →