How Effective Are Publicly Accessible Deepfake Detection Tools? A Comparative Evaluation of Open-Source and Free-to-Use Platforms

本文通过专业调查员的盲测评估,首次对比了六款公开可及的深伪检测工具,发现法医分析工具与 AI 分类器在召回率和特异性上各有所长但均不及人类判断,且人机判断不一致时人类结论通常更为可靠。

Michael Rettinger, Ben Beaumont, Nhien-An Le-Khac, Hong-Hanh Nguyen-Le

发布于 2026-03-06
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是一次**“真假美猴王”的实战大考**。

现在的 AI 技术太厉害了,能制造出以假乱真的“深度伪造”(Deepfake)照片和视频。为了抓出这些假货,市面上有很多免费的检测工具。但这篇论文的作者(来自都柏林大学的专业调查员)想搞清楚:这些免费工具到底好不好用?它们真的能帮到警察和普通人吗?

他们找了 6 个免费工具,让两位经验丰富的“老侦探”亲自上阵,用 250 张真假难辨的图片进行了盲测。

以下是这篇论文的“大白话”解读:

1. 两大派系的“性格差异”

作者把检测工具分成了两派,就像两种不同风格的侦探:

  • 第一派:法医分析派(Forensic Tools)

    • 代表工具:InVID, FotoForensics, Forensically。
    • 工作方式:它们像显微镜。它们不直接告诉你“这是假的”,而是把图片放大,展示各种痕迹(比如噪点、压缩痕迹、光线不一致)。
    • 优点:非常敏感。只要图片有一点点不对劲(哪怕是真的图片被压缩过),它们就会大喊“有鬼!”。
    • 缺点太容易误报。就像那个“狼来了”的故事,它们经常把正常的照片当成假照片。而且,你需要是个专家才能看懂那些复杂的图表。
    • 比喻:就像一个极度敏感的烟雾报警器,哪怕你只是烤焦了一片面包,它也会尖叫。
  • 第二派:AI 分类派(AI Classifiers)

    • 代表工具:DecopyAI, FaceOnLive, Bitmind。
    • 工作方式:它们像黑盒子的算命先生。你丢给它一张图,它直接告诉你:“这是真的”或“这是假的”,并给你一个信心分数。
    • 优点反应快,不容易误报。如果它说“这是真的”,那大概率是真的。
    • 缺点经常漏网之鱼。如果 AI 没见过某种新的造假技术(比如用最新的 HeyGen 生成的视频),它就完全看不出来,还会自信满满地告诉你“这是真的”。
    • 比喻:就像一个经验丰富的保安,如果没看到明显的坏人,他就觉得大家都安全。但如果坏人穿了件他没见过的隐身衣,他就完全看不见了。

2. 核心发现:人比机器强太多

这是论文最扎心的结论:

  • 人类侦探(专家)是王者:在测试中,人类专家的正确率高达 94%,远超所有工具。
  • 机器互相“打架”
    • 法医工具经常冤枉好人(把真图当假图)。
    • AI 工具经常放过坏人(把假图当真图)。
    • 当机器和人意见不一致时,90% 以上的情况是人对、机器错。特别是当机器自信满满地说“这是真的”时,往往就是它被骗得最惨的时候。

3. 为什么机器会“翻车”?

  • 法医工具:太依赖“痕迹”。现在的 AI 生成技术太完美了,连噪点和光线都模拟得很像真的,所以显微镜找不到破绽。
  • AI 工具:太依赖“记忆”。它们是在特定的数据集上训练的。如果造假者用了新的技术(比如 HeyGen 或新的扩散模型),就像换了个新面具,AI 就认不出来了。
    • 特别案例:所有 AI 工具在面对 HeyGen(一种商业换脸工具)生成的图片时,全部失效,100% 把它们当成了真图。

4. 给普通人和警察的建议

既然没有完美的工具,我们该怎么办?作者给出了一个**“混合双打”**的策略:

  1. 不要只信一个工具:就像破案不能只靠一个线索。
  2. 先快后慢
    • 先用AI 工具快速筛查(因为它们快,而且如果它说“这是假的”,那大概率是真的假)。
    • 把那些 AI 觉得“可能是真的”或者“拿不准”的图片,交给法医工具去仔细检查痕迹。
  3. 最终拍板靠人:无论工具怎么说,人类专家的直觉和逻辑判断才是最后的防线。特别是当机器和人类意见不一致时,相信人类
  4. 把结果当“线索”而非“判决”:工具给出的结果只是参考,不能作为法庭上的铁证,除非有人类专家的详细解释。

总结

这就好比抓小偷

  • 法医工具是那个见谁都喊“抓贼”的邻居,虽然吵,但能防止漏网之鱼,只是容易误伤。
  • AI 工具是那个只抓穿红衣服小偷的保安,如果小偷穿蓝衣服,他就看不见。
  • 人类专家老刑警,能综合各种线索,一眼看穿真相。

结论:目前的免费工具都还不够完美,不能单靠它们。最好的办法是**“人机协作”**:用机器做初筛,用人来做最终判断。在 AI 造假技术飞速发展的今天,人类的智慧依然是最强大的防伪盾