Manipulating language models' training data to study syntactic constraint learning: the case of English passivization

该研究通过操纵语言模型的训练数据,利用英语被动化例外现象证实了动词的被动化能力既受频率(固化)也受语义(受影响性)的独立影响,并展示了通过控制输入数据来探究语言习得机制的方法论价值。

Cara Su-Yi Leong, Tal Linzen

发布于 2026-03-05
📖 2 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是一场**“语言侦探游戏”。研究者们想搞清楚:人类(以及电脑)是怎么学会语言中那些“看似有规则,其实有例外”**的奇怪现象的?

为了讲清楚这个研究,我们可以把语言学习想象成**“学习做菜”**。

1. 核心谜题:为什么有些菜不能“反着做”?

在英语里,大多数动词都可以把“主动语态”变成“被动语态”。

  • 主动: 厨师了苹果。(The chef cut the apple.)
  • 被动: 苹果被切了。(The apple was cut by the chef.)
    这就像做菜,通常你可以把“谁做了什么”改成“什么被谁做了”,这很自然。

但是,有些动词绝对不能这么改。

  • 主动: 会议持续了一小时。(The meeting lasted one hour.)
  • 被动: ❌ 一小时被持续了。(*One hour was lasted by the meeting.)

这就很奇怪了!为什么“切”可以被动,而“持续”就不行?

  • 谜题: 小孩子从来没听过“一小时被持续了”这句话(因为没人这么说),他们是怎么知道这句话是错的,而不是仅仅没听过的?这就是语言学里著名的“贝克悖论”(Baker's Paradox):如何从“没发生”中学到“不可能发生”?

2. 侦探工具:用 AI 当“语言实习生”

研究者没法把人类小孩关起来,只给他们看特定的句子(这太不道德也不现实了)。于是,他们找来了**人工智能(语言模型)**当“实习生”。

  • 为什么选 AI? 因为我们可以完全控制 AI 看到的“教材”(训练数据)。我们可以像编辑食谱一样,故意删掉某些句子,或者把某些词换掉,看看 AI 会怎么反应。这就像给实习生看一本**“被篡改过的菜谱”**,观察他会不会学会错误的做法。

3. 两个嫌疑理论:AI 是怎么猜出规则的?

研究者提出了两个关于“例外”来源的假说,就像两个嫌疑人:

  • 嫌疑人 A:频率派(Entrenchment Hypothesis)

    • 比喻:没见过的就是错的”。
    • 逻辑: 如果一个词(比如“持续”)在“主动句”里出现了 1000 次,但在“被动句”里一次都没出现过,AI 就会想:“哦,看来这个词从来不用被动,那它肯定不能被动。”
    • 核心:统计数字(出现次数)来判断。
  • 嫌疑人 B:意义派(Affectedness Hypothesis)

    • 比喻:只有被‘折腾’过的东西才能被动”。
    • 逻辑: 被动语态通常意味着主语“受到了影响”或“发生了改变”。
      • “切苹果”:苹果被切了,状态变了(从完整变破碎),所以可以被动。
      • “持续一小时”:时间并没有被会议“折腾”或“改变”,它只是在那里流逝,所以不能被动。
    • 核心:语义理解(动作是否改变了对象)来判断。

4. 实验过程:给 AI 的“特训营”

研究者设计了三场实验,就像给 AI 实习生安排了三套不同的“特训”:

  • 实验一:先看看 AI 像不像人

    • 让 AI 读 1 亿个单词(相当于人类到青春期看到的语言量)。
    • 结果: AI 的判断和人类高度一致(相关性 0.9)。AI 也知道“持续”不能被动,“切”可以。这说明教材里确实藏着线索
  • 实验二 A:测试“频率派”

    • 操作: 挑几个本来可以被动的好动词(比如“扔”),故意在教材里删掉它们所有的被动句,只保留主动句,让它们的“主动/被动比例”变得和“持续”一样高。
    • 结果: AI 真的开始觉得这些词不能被动了!
    • 结论: 频率确实起作用。如果 AI 很少见到某个词的被动用法,它就会认为那是错的。
  • 实验二 B:测试“意义派”

    • 操作: 挑几个本来不能被动的词(比如“持续”),强行把它们放进**“被折腾”**的句子里(比如把“持续”放进“扔”、“打”这种通常有受事者的句子里)。
    • 结果: AI 对这些词的被动接受度稍微提高了。
    • 结论: 意义也有作用。如果 AI 觉得这个词在某种语境下“影响了对象”,它就更愿意接受它的被动形式。
  • 实验三:终极对决(新词测试)

    • 操作: 发明一个完全不存在的新词(比如"Zorp"),只让它出现在“主动句”里。
      • 组 1:让"Zorp"在“被折腾”的句子里出现很多次(高受影响)。
      • 组 2:让"Zorp"在“没被折腾”的句子里出现很多次(低受影响)。
      • 同时,改变它出现的总次数(频率)。
    • 结果:
      1. 频率越高,AI 越觉得它不能被动(频率派赢了)。
      2. 语境越“被折腾”,AI 越觉得它能被动(意义派也赢了)。
      3. 关键点: 这两个因素是独立工作的,互不干扰。就像做菜时,盐放多了(频率)和火候太猛(意义)是两个独立的问题。

5. 最终结论:人类和 AI 的异同

  • 共同点: 无论是人类小孩还是 AI,学习语言时都在偷偷做两件事:

    1. 数数: “这个词我见过多少次被动用法?”(频率/固化)
    2. 理解: “这个动作会让对象发生变化吗?”(语义/受影响)
      这两者结合起来,让我们学会了哪些动词可以“反着说”,哪些不行。
  • 不同点:

    • AI 纯粹靠统计模式匹配。它没有真实的生活体验,它不知道“苹果被切”意味着苹果真的碎了,它只是看到“切”和“碎”经常一起出现。
    • 人类 除了看统计,还有真实世界的体验(我们知道苹果被切会碎,时间流逝不会碎)。人类的学习还包含社交互动(大人会纠正小孩)。

总结

这篇论文告诉我们:语言学习不仅仅是死记硬背规则,也不是完全靠直觉。它是一场**“统计”与“意义”的合谋**。

  • 如果你经常听到“被...",你就会觉得可以“被..."。
  • 如果你发现某个动作没让东西变样,你就会觉得不能“被..."。

研究者通过**“篡改 AI 的教材”**这种巧妙的方法,像做手术一样,精准地切开了语言学习的黑盒,让我们看到了大脑(以及 AI 大脑)是如何从混乱的语言输入中,提炼出那些微妙的语法规则的。