Locating and Editing Figure-Ground Organization in Vision Transformers

该研究通过合成形状冲突实验发现,BEiT 模型在早期和中间层对凸凹补全存在感知模糊,而图底组织偏好最终在深层由注意力头 L0H9 主导确立,且通过下调该头可逆转模型的凸性偏好。

Stefan Arnold, René Gröbner

发布于 2026-03-09
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是一次对人工智能(AI)大脑的“深度解剖”,目的是搞清楚它在看图时,到底是怎么决定“哪个是物体,哪个是背景”的。

为了让你更容易理解,我们可以把这篇论文的研究过程想象成侦探破案调音师修琴的故事。

1. 核心谜题:AI 眼中的“图与底”

想象你看到一张图,上面画了一个像飞镖一样的形状(中间有个凹进去的缺口)。

  • 人类的大脑(以及大多数 AI):通常会自动把这个缺口“补”成一个完整的三角形。在心理学上,这叫凸性优先(Convexity)。我们倾向于把凸出来的部分看作“物体”(图),把凹进去的部分看作“背景”(底)。
  • AI 的困惑:如果 AI 只看局部,它应该看到那个凹进去的缺口;但如果它看整体,它应该看到一个完整的三角形。这就产生了一个感知冲突:是相信眼前的局部证据(凹),还是相信整体的直觉(凸)?

2. 实验设计:给 AI 出“陷阱题”

作者们给一种叫 BEiT 的 AI 模型(一种视觉 Transformer)出了一套特殊的“填空题”。

  • 题目:他们把飞镖形状中“凹进去”的那部分挖空(遮住),让 AI 去猜被遮住的部分是什么。
  • 两种可能
    1. 凸性完成:AI 猜被遮住的是三角形的一部分,把缺口补平(认为那是背景)。
    2. 凹性完成:AI 猜被遮住的就是飞镖的缺口,保持原样(认为那是物体)。
  • 结果:在正常情况下,BEiT 几乎总是选择补平缺口(凸性),就像人类一样,它“脑补”出了一个完整的三角形。

3. 深度解剖:AI 的“大脑”里发生了什么?

作者没有止步于观察结果,他们想知道:AI 是在哪一步、由谁决定了要“脑补”这个三角形

他们使用了一种叫“归因分析”的技术,就像给 AI 的每一个神经元和连接点装了监控摄像头

  • 发现一:犹豫不决的前半程
    在 AI 处理图片的早期和中期(前几层),它的大脑里其实是一片混乱。有的信号说“这是凹的”,有的信号说“那是凸的”。就像一群人开会,大家还在争论,没有定论。
  • 发现二:突然的“拍板”
    到了最后几层,AI 突然就“想通了”,坚定地选择了“凸性”。
  • 发现三:幕后黑手(关键角色)
    作者进一步深挖,发现了一个非常微小的“捣蛋鬼”——第 0 层第 9 号注意力头(Head L0H9)。
    • 比喻:想象 AI 的大脑是一个巨大的交响乐团。在乐曲刚开始(第 0 层)的时候,有一个不起眼的乐手(L0H9)轻轻吹了一下长笛,发出了一个微弱的“凸”的信号。
    • 虽然这个信号很弱,但它就像第一块倒下的多米诺骨牌。随着信号在后续层级的传递和放大,这个微弱的“凸”信号最终压倒了所有“凹”的证据,导致 AI 最终做出了“补全三角形”的决定。

4. 魔法干预:强行改变 AI 的想法

既然找到了这个“幕后黑手”,作者决定修改它,看看能不能让 AI 改变主意。

  • 操作:他们把这个“捣蛋鬼”(L0H9)的声音调小(把它的激活值乘以 0.3)。
  • 结果:奇迹发生了!
    • 原本 AI 会坚定地补全三角形。
    • 现在,因为那个微弱的“凸”信号被压制了,AI 终于听进了局部证据。它不再补全三角形,而是正确地画出了那个凹进去的飞镖缺口
  • 意义:这证明了 AI 的“凸性偏好”并不是一个不可改变的铁律,而是由特定的、可识别的电路单元控制的。只要调整这个单元,就能改变 AI 的“世界观”。

5. 总结:这对我们意味着什么?

这篇论文告诉我们:

  1. AI 像人一样有“直觉”:AI 确实学会了像人类一样,优先把凸出的部分看作物体。
  2. 直觉是有迹可循的:这种“直觉”不是黑箱操作,而是由具体的、微小的电路单元(如 L0H9)在早期阶段种下的“种子”。
  3. 我们可以“调教”AI:如果我们能识别并调整这些关键单元,就能在特定情况下(比如医疗影像诊断中,不能漏掉微小的凹坑)强行让 AI 忽略“直觉”,更关注“细节”。

一句话总结
作者通过给 AI 出“填空题”,发现 AI 之所以喜欢把缺口补成三角形,是因为有一个微小的“大脑开关”在早期悄悄推了它一把;作者通过关掉这个开关,成功让 AI 从“脑补模式”切换到了“实事求是模式”。这让我们对 AI 如何“看”世界有了更深的理解,也让我们拥有了控制这种“看”法的能力。