SuperADD: Training-free Class-agnostic Anomaly Segmentation -- CVPR 2026 VAND 4.0 Workshop Challenge Industrial Track

本文提出了 SuperADD,这是一种无需训练、类别无关的异常分割流程,它利用 DINOv3 骨干网络和鲁棒的预处理技术,在无需针对每个类别进行超参数调优的情况下,于具有挑战性的分布偏移条件下在 MVTec AD 2 数据集上实现了最先进的性能。

原作者: Lukas Roming, Felix Lehnerer, Jonas V. Funk, Andreas Michel, Georg Maier, Thomas Längle, Jürgen Beyerer

发布于 2026-05-15✓ Author reviewed
📖 1 分钟阅读☕ 轻松阅读

原作者: Lukas Roming, Felix Lehnerer, Jonas V. Funk, Andreas Michel, Georg Maier, Thomas Längle, Jürgen Beyerer

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,你是大型工厂的质量控制主管。你的工作是在传送带上滚动的产品中找出微小的缺陷。通常,你拥有一支专家团队,他们研究过成千上万个完美产品。他们确切知道一个“合格”的墙壁插座、一块布料或一罐果酱应该是什么样子。如果他们看到与完美记忆不符的东西,就会将其标记为缺陷。

然而,有一个棘手之处:工厂的照明条件不断变化。有时明亮,有时昏暗,有时阴影怪异。这让专家们感到困惑,因为同一件完美产品在不同光照下看起来截然不同。他们可能会在实际上只是阴影时大喊“缺陷!”,或者更糟的是,因为光线将其掩盖而漏掉真实的裂纹。

本文提出了一种名为SuperADD的全新超智能系统,旨在解决这一确切问题。以下是其工作原理,分解为简单概念:

1. “无需训练”的超能力

大多数 AI 系统就像学生,需要在教室里坐上好几个月,才能学会每种特定产品的缺陷长什么样。如果你引入新产品或改变照明,就必须送它们回学校重新学习一切。

SuperADD则不同。它像一名侦探,无需事先研究特定产品。它使用一个预训练的“大脑”(称为DINOv3),该大脑已经看过互联网上的数百万张图片。它了解“正常”纹理和形状通常的样子。因为它无需为每条新生产线重新训练,所以可以立即部署。这是一种“即插即用”的解决方案。

2. “记忆库”策略

该系统不是试图记住每一张完美图像,而是构建一个记忆库

  • 想象你给一个完美的墙壁插座拍了一张照片。
  • 系统将这张照片分解成千上万个微小的拼图碎片(图像块)。
  • 它将这些碎片的“本质”保存到一个巨大的图书馆(记忆库)中。
  • 当新产品来到传送线上时,系统将其分解为相同的拼图碎片,并问道:“我的图书馆里有与这块完美匹配的吗?”
  • 如果某块碎片在图书馆中找不到任何匹配项,它就会被标记为异常(异常点)。

3. “重叠拼图”技巧

该系统的原始版本存在一个问题:它以大的、不重叠的区块来观察产品。如果缺陷恰好位于两个区块之间的分界线上,系统可能会漏掉它或感到困惑,就像试图阅读一个被书本装订线切断一半的单词。

SuperADD通过使用重叠图像块解决了这个问题。想象透过一扇滑动的窗户观察产品,但这扇窗户非常大,以至于它与上一视角重叠。这确保了无论缺陷位于何处,都能从多个角度被清晰地看到,从而使系统更加可靠。

4. “光照模拟器”

为了应对工厂照明的变化,系统在设置阶段不会仅仅按原样查看训练照片。它会人为地调暗和调亮图像。这就像为了考试做准备,先在暗室学习,然后在亮室学习,接着在闪烁灯光的房间学习。这训练系统忽略光照变化,只专注于产品的实际形状和纹理。

5. “形态学闭运算”(粘合剂)

有时,系统会检测到缺陷,但结果看起来像是一条断裂的虚线,而不是一条实心的划痕。就像看到汽车上的划痕,但只有中间部分被高亮显示。

为了解决这个问题,SuperADD 使用了一个称为形态学闭运算的步骤。将其想象成一种神奇的胶水。它查看那些断裂的、点状的高亮区域,并轻轻地将它们连接起来,形成一个实心、平滑的形状。它还会填充缺陷区域内的任何微小孔洞,确保最终报告呈现出问题完整、清晰的图像。

结果

该系统在一项激烈的竞赛(VAND 4.0 工业赛道)中进行了测试,使用的数据集名为MVTec AD 2,其中包含棘手物品,如闪亮的金属罐、透明罐子和成堆的大米。

  • 挑战:测试数据的光照条件与训练数据不同,且系统必须使用相同的设置(不对每个物体进行自定义调整)来处理所有不同类型的物体。
  • 结果:SuperADD 获胜。它在所有竞争对手中取得了最高分数。
    • 它正确识别布料缺陷的准确率约为 88%。
    • 它正确识别大米缺陷的准确率约为 74%。
    • 最重要的是,它击败了之前的最佳方法,证明了无需为每种产品定制复杂的训练 AI 也能获得出色的结果。

总结

SuperADD是一种智能、灵活且快速的方法,用于检测工厂缺陷,无需为每种新产品或光照变化重新训练 AI。它利用预训练的大脑,通过重叠观察产品以避免遗漏细节,通过模拟光照变化进行练习以保持稳健,并使用“胶水”确保最终的缺陷图清晰完整。这是一种真正“万能”的解决方案。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →