One Language, Two Scripts: Probing Script-Invariance in LLM Concept Representations

この論文は、スパースオートエンコーダ(SAE)が学習した特徴量が表面の文字化(トークン化)に依存せず、意味の抽象レベルで表現されていることを、異なる文字体系(ラテン文字とキリル文字)で書かれた同じ意味のセルビア語を用いた Gemma モデルの分析により実証し、モデルの規模が大きいほどこの「文字体系不変性」が強化されることを示しています。

Sripad Karne

公開日 Wed, 11 Ma
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文は、**「AI は言葉の『意味』を本当に理解しているのか、それとも単に『文字の並び』を覚えているだけなのか?」**という疑問に答える、とても面白い実験結果を報告しています。

専門用語を使わず、わかりやすい例え話で解説しましょう。

🏰 物語の舞台:セルビアという「二つの顔」を持つ国

まず、実験の舞台となるセルビア語という言語についてお話しします。
セルビア語には、**「ラテン文字(A, B, C...)」「キリル文字(А, Б, В...)」**という、2 つの全く異なる文字体系があります。

  • 特徴 1: 国民はどちらも使い分け、意味は100% 同じです(例:「猫」はどちらの文字でも「猫」です)。
  • 特徴 2: しかし、AI がこの文字を処理する仕組み(トークナイザー)は、ラテン文字とキリル文字を全く別のものとして扱います。まるで、同じ「リンゴ」を、片方は「赤い果物」と呼び、もう片方は「丸い果物」と呼んで、全く別の単語として登録しているようなものです。

この「意味は同じなのに、AI にとっては全く別の言葉に見える」という状況が、実験にはうってつけの「実験室」になりました。

🔍 実験の道具:SAE(Sparse Autoencoders)という「X 線カメラ」

研究者たちは、AI の頭の中を覗くための**「SAE(スパース・オートエンコーダ)」という道具を使いました。
これを
「AI の思考を分解して、どんな『概念』が光っているか見る X 線カメラ」**と想像してください。

  • AI が何かを考えると、無数の小さな「概念(Feature)」が光ります。
  • 例えば、「犬」という言葉が来ると、「動物」「毛深い」「吠える」といった概念が光ります。
  • この実験では、「同じ意味の文章」を、ラテン文字とキリル文字の両方で入力したとき、AI の頭の中で光る「概念」が同じになるかを確認しました。

🎭 実験の結果:驚くべき「意味の一致」

もし AI が単に「文字の並び」を暗記しているだけなら、ラテン文字とキリル文字では、全く違う概念が光るはずでした。しかし、結果は違いました。

  1. 同じ意味、違う文字でも「同じ光り方」

    • 「私は猫が好き」という文章を、ラテン文字で入力しても、キリル文字で入力しても、AI の頭の中でほぼ同じ「概念」が光りました
    • 数字で言うと、約 58% の概念が共通していました(ランダムな文章同士なら 28% しか重なりません)。
    • これは、「文字の形(見た目)」よりも「意味(中身)」の方が、AI の頭の中では重要視されていることを示しています。
  2. パラフレーズ(言い換え)よりも「文字の違い」の方が影響が少ない

    • 面白いことに、**「同じ文章を違う文字で書くこと」よりも、「同じ文字で言い換えること(パラフレーズ)」**の方が、AI の頭の中の変化(概念のズレ)が大きいことがわかりました。
    • つまり、AI は「文字が変わる」ことにはあまり気にしませんが、「言葉の選び方(ニュアンス)」には敏感だということです。
  3. AI が大きくなると、より賢くなる

    • 小さな AI(2 億パラメータ)よりも、巨大な AI(270 億パラメータ)の方が、この「文字を越えた意味の理解」が上手でした。
    • 巨大な AI は、ラテン文字でもキリル文字でも、**「同じ意味なら同じように理解する」**という能力がさらに高まっていました。

🧩 重要な発見:「丸暗記」ではない

「もしかして、AI は訓練データに『ラテン文字の A 文』と『キリル文字の A 文』がセットで入っていたから、それを丸暗記しただけでは?」という疑問が湧きます。

しかし、研究者は**「ラテン文字の A 文」と「キリル文字の B 文(言い換え)」を混ぜてテストしました。これらは訓練データに一度もセットで現れていない組み合わせですが、それでも AI は「意味が通じる」と判断し、同じ概念を光らせました。
これは、
「丸暗記」ではなく、本当に「意味」を抽象的に理解している**という強力な証拠です。

💡 まとめ:AI は「文字の皮」を剥いで「中身」を見ている

この研究が教えてくれることは、とても希望に満ちています。

  • AI は、文字の形(ラテンかキリルか)に縛られていません。
  • AI は、言葉の「意味」という核(核となる概念)を、文字の皮を剥いで捉えることができるようになっています。

まるで、**「同じ料理を、器が違っても(ラテンかキリルか)、その美味しさ(意味)を同じように感じ取れる」**ようなものです。

この発見は、世界中の異なる言語や文字体系を持つ人々にとって、AI がより公平に、より深く理解してくれる未来への一歩を示しています。また、AI の「思考」を解明する新しい方法(セルビアの二文字体系を使う方法)も提案されました。

一言で言えば:
「AI は、文字の見た目ではなく、その奥にある『心(意味)』を理解し始めている」という、とても心温まる発見だったのです。