Manipulating language models' training data to study syntactic constraint learning: the case of English passivization

この論文は、英語の受動態の例外を学習するメカニズムを調査するために言語モデルの訓練データを操作し、語彙の定着度と意味的要素の両方がその制限の学習に独立して寄与することを示しました。

Cara Su-Yi Leong, Tal Linzen

公開日 2026-03-05
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

🎭 物語の舞台:「英語の受動態」というルール

まず、英語には「受動態(〜される)」という文法ルールがあります。
例えば、「私がリンゴを食べた(Active)」は、「リンゴが私に食べられた(Passive)」と言い換えられます。これは多くの動詞で通用する、とても便利なルールです。

しかし、例外があります。

  • ✅ 「会議は 1 時間続いた」→「1 時間が会議によって続いた」はNG(不自然)。
  • ✅ 「作家が編集者を窓から突き落とした」→「編集者が作家によって窓から突き落とされた」はOK

なぜ「続いた(last)」はダメで、「突き落とした(defenestrate)」は OK なのでしょうか?
実は、子供はこのルールを「先生に教わる」のではなく、**「周りの言葉を聞いて、自分で推測して」**覚えます。これを「間接的な証拠から学ぶ」と言います。

この研究では、AI(言語モデル)を「言語を学ぶ子供」に見立てて、AI がどうやってこの例外を学んでいるのかを調べる実験を行いました。


🔍 実験の核心:2 つの仮説を疑ってみる

研究者たちは、AI が例外を学ぶために使っている「ヒント」が何かを特定するために、2 つの仮説を立てました。

  1. 「慣れ(Entrenchment)」仮説

    • 考え方: 「その動詞が『能動態(主語が action する形)』で使われる回数が圧倒的に多く、『受動態』で使われる回数がゼロに近いなら、AI は『あ、これは受動態にできないんだな』と学習するはずだ」。
    • 例え: 「『猫』という単語が、いつも『猫が走る』という文でしか出てこないのに、『走られる猫』という文が一度も出てこなければ、AI は『猫は走られないんだ』と学習する」。
  2. 「影響(Affectedness)」仮説

    • 考え方: 「その動詞の意味が、対象に『変化』や『影響』を与えているかどうか」。
    • 例え: 「食べる」はリンゴを消滅させたり変えたりするので「影響あり(受動態 OK)」。一方、「続く」は時間をただ経過させるだけで、時間を「変えたり」しないので「影響なし(受動態 NG)」。AI はこの意味のニュアンスを学んでいるはずだ。

🧪 実験方法:AI の「食事(学習データ)」を操作する

この研究のすごいところは、AI の学習データ(食事)を人工的に操作して、何が原因で学習結果が変わるかを調べた点です。まるで、子供に「野菜だけ食べさせて、お肉は与えない」ような実験です。

実験 1:AI は人間と同じように判断できるか?

  • 方法: 1 億語(人間の思春期までに聞く言葉の量に相当)のデータで AI を学習させました。
  • 結果: 驚くべきことに、AI が「この文は不自然だ」と判断する度合いは、**人間と非常に高い一致(90% 以上)**を示しました。AI も人間と同じように、微妙なニュアンスの違いをキャッチしていました。

実験 2A:「頻度(慣れ)」を操作する

  • 方法: 本来は受動態で使える動詞(例:drop/落とす)を、学習データから**「受動態の文」を無理やり削除**し、「能動態」だけ大量に残すようにしました。
  • 結果: AI は「あ、この動詞は受動態で使われていないな」と学習し、「受動態にできない」と判断するようになりました
  • 結論: 「頻度(慣れ)」は、AI が例外を学ぶための重要なヒントの一つであることが証明されました。

実験 2B:「意味(影響)」を操作する

  • 方法: 本来は受動態にできない動詞(例:last/続く)を、「影響を与える動詞(例:hit/殴る)」と同じような文脈(文法構造)に混ぜて学習させました。
  • 結果: AI は「この動詞は、何かを変えているように見えるな」と学習し、「受動態にできるかもしれない」と判断するようになりました
  • 結論: 「意味(影響)」もまた、重要なヒントであることがわかりました。

実験 3:新しい動詞でテスト

  • 方法: 学習データに存在しない「新しい動詞」を、「影響を与える文脈」か「与えない文脈」のどちらかで、何回も登場させるようにしました。
  • 結果:
    • 登場回数が多いほど(慣れ)、受動態にできなくなりました。
    • 影響を与える文脈で登場したほうが、受動態にできやすくなりました。
    • 重要発見: この 2 つの要素は**「足し算」**の関係で、お互いに干渉し合うことなく独立して働いていることがわかりました。

💡 この研究が教えてくれること

  1. AI は「統計」と「意味」の両方で学んでいる
    AI は、単に「この言葉は受動態で使われていないから NG」という統計的な頻度だけでなく、「この言葉の意味は受動態のルールに合わない」という意味的なヒントも組み合わせて学習していることがわかりました。

  2. 人間と AI は似ているが、違う
    AI は人間と同じような判断を下せますが、それは「意味を深く理解しているから」ではなく、「言葉の並び方のパターンを統計的に見極めているから」かもしれません。人間は「影響」を直感的に理解しますが、AI は「影響を与える文脈でよく使われる」というパターンを覚えているだけかもしれません。

  3. 研究の新しい道
    人間の子供に「受動態の文を一切聞かせない」という実験は倫理的にできません。しかし、AI ならデータの操作が自由です。このように「AI の学習データをいじる」方法は、人間の言語習得の謎を解くための強力なツールになることが示されました。

🌟 まとめ

この論文は、**「AI の学習データという『食卓』をいじくることで、言語学習の『レシピ』を解明した」**という画期的な研究です。

AI は、**「頻度(慣れ)」「意味(影響)」**という 2 つの異なるヒントを組み合わせることで、複雑な文法の例外さえも学習できることを示しました。これは、私たちが言葉をどうやって学ぶのか、そして AI がどうやって人間のように振る舞うのかを理解する上で、大きな一歩となりました。