On Pitfalls of RemOve-And-Retrain\textit{RemOve-And-Retrain}: Data Processing Inequality Perspective

本文表明,由于后处理归因图可以在不增加信息的情况下人为地提高评分,揭示了对空间模糊掩码的系统性偏好,从而破坏了 RemOve-And-Retrain (ROAR) 基准测试的有效性,并削弱了其准确评估特征归因方法的能力。

原作者: Junhwa Song, Keumgang Cha, Junghoon Seo

发布于 2026-06-12
📖 1 分钟阅读☕ 轻松阅读

原作者: Junhwa Song, Keumgang Cha, Junghoon Seo

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,你正试图弄清楚一位厨师是如何决定要做哪道菜的。你有一份食材清单(输入数据)和一本食谱(神经网络)。为了理解厨师的逻辑,你使用了一种特殊的工具,叫做“归因图”(attribution map)。这个工具会高亮显示哪些食材对于最终口味最为重要。

多年来,研究人员一直使用一种名为 ROAR(移除并重训,Remove-And-Retrain)的测试,来观察这些高亮工具是否准确。该测试的逻辑很简单:

  1. 提取被高亮显示的食材。
  2. 把它们扔掉(移除)。
  3. 只用剩下的食材教给厨师一套新食谱。
  4. 如果厨师在使用剩下的食材时变得非常糟糕,这意味着高亮工具找到了真正的重要食材,那么这个工具就是好的。如果厨师仍然能做得很好,说明该工具漏掉了关键食材。

问题所在:“模糊掩码”陷阱

本文认为 ROAR 测试存在一个隐藏的缺陷。事实证明,你可以在没有真正理解厨师食谱的情况下,“作弊”通过这个测试。

作者发现,如果你将高亮工具的输出结果进行模糊处理(使其变得模糊或平滑),ROAR 测试通常会给你一个“更好”的分数。在这一测试的世界里,“更好的”分数意味着在你移除食材后,厨师的表现下降得更多

这里有一个类比:
假设高亮工具在厨师需要的某种特定香料周围画了一个清晰、精确的圆圈。

  • 诚实的方式: 你只移除了那一种香料。厨师感到有些吃力。
  • “模糊”的方式: 你把同一个圆圈涂抹开,直到它覆盖了一大片模糊的区域,从而不小心移除了那种香料以及许多其他随机的、无关紧要的物品。
  • 结果: 因为你移除了太多东西(包括真正的香料),厨师彻底失败了。ROAR 测试会说:“哇,这个高亮工具太棒了!它导致了性能的大幅下降!”

但工具本身并没有变得更聪明。它只是碰巧创建了一个“模糊的掩码”,从而意外地移除了更多的重要内容。

“信息”法则(数据处理不等式)

论文使用了一个被称为数据处理不等式(Data Processing Inequality)的数学规则来证明这一点。把它想象成信息领域的一条物理定律:

  • 你不能仅仅通过处理数据来创造新的信息。
  • 如果你把一张清晰的照片变模糊,你会丢失细节;你并不会挖掘出关于厨师思维的更多秘密。

作者证明了,即使模糊处理地图会丢失关于厨师真实逻辑的信息,它仍然可以欺骗 ROAR 测试,让测试认为这张图更好。这意味着高 ROAR 分数并不一定意味着该工具理解了模型;它可能只是意味着该工具产生了一个“模糊”的掩码,从而在无意中删除了更多的图像数据。

实验:涂抹 vs 精确

为了证明这一点,研究人员在三个不同的图像数据集(如动物、汽车和街道数字的照片)上进行了实验。他们对标准的高亮工具应用了简单的“涂抹”技术(如高斯模糊或最大池化),在运行 ROAR 测试之前对地图进行了处理。

研究结果:

  • 在几乎所有案例中,模糊处理后的地图比原始的精确地图获得了更好的 ROAR 分数。
  • 他们还将“像素随机”(擦除随机的点)与“区块随机”(擦除一个大的实心方块)进行了比较。那个大方块(更“模糊”且更有结构性)移除了更多有意义的信息,并获得了更高的分数,尽管它本身并不更聪明。

核心结论

本文的结论是,我们在使用 ROAR 测试时需要非常谨慎。仅仅因为一种方法得到了高分,并不意味着它找到了关于 AI 如何运作的“真相”。它可能只是恰好创建了能意外删除更多图像内容的“模糊”掩码的方法。

启示: 不要仅仅信任分数。如果一种方法看起来更“模糊”且得分更高,它可能只是测试本身的一个陷阱,而不是理解力提升的标志。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →