Infinite Words with very Low Factor Complexity: an introduction to Combinatorics on Words

この論文は、有限文字列における最小の因子複雑性を持つ無限語(特にスチュルミ語など)を中核テーマとし、力学・代数・算術との相互作用を解説するとともに、1999 年のティデマンの定理に対する 2022 年の新しい代数的証明とその帰結を提示する、組合せ論的単語論への入門書である。

Mélodie Andrieu

公開日 Tue, 10 Ma
📖 1 分で読めます🧠 じっくり読む

Each language version is independently generated for its own context, not a direct translation.

この論文は、**「無限に続く文字の列(単語)」**が、どれほど「単純」か「複雑」かを測る数学的な研究です。

タイトルにある「Factor Complexity(因数の複雑さ)」とは、簡単に言うと**「その文字列の中に、長さ n の『小さな断片』が何種類現れるか」**を数えることです。

例えば、121212... という文字列なら、長さ 2 の断片は「12」と「21」の 2 種類しかありません。一方、123456... のようにランダムな文字列なら、長さ 2 の断片はもっと多く、12, 13, 14... と次々と増えます。

この論文は、**「どんなに複雑に見えても、実は非常に単純なルールでできている『特別な文字列』」**について、2 文字の場合から、3 文字、4 文字と増やした場合までを解明しようとしています。

以下に、難しい数学用語を使わず、日常の例え話で解説します。


1. 物語の舞台:「文字列の森」と「迷路」

まず、無限に続く文字列を**「無限に続く道」**だと想像してください。
その道には、123 といった「標識(文字)」が並んでいます。

  • 複雑さ(Complexity):
    この道を歩いているとき、「長さ 3 の区間」を眺めたとき、何通りの「景色(標識の並び)」が見えるでしょうか?
    • 景色が 1 種類しかないと、道は単純な「ループ」です(例:121212...)。
    • 景色が無限に増えると、道は完全にランダムで予測不能です。
    • この論文が探しているのは、「景色が『最小限』しか増えないが、決してループしない(単純な繰り返しではない)道」です。

2. 第一章:2 文字の世界(ストルミアン語)

まず、標識が 12 だけの世界を考えます。

  • モーゼとヘドランドの定理(1938 年):
    「もし道が『ループ(繰り返し)』なら、景色の種類は有限で止まる。逆に、景色の種類が『n 以下』に収まるなら、その道は必ずループしている」
    つまり、「ループしない道」なら、景色の種類は必ず「n+1 種類」以上必要だと言っています。

  • ストルミアン語(Sturmian words):
    「ループしない道」の中で、最も景色が少なく(n+1 種類)、最も単純な道があります。これを「ストルミアン語」と呼びます。

    • 例え: これは、**「黄金比(フィボナッチ数列)」**という特別な比率で 12 を並べた道です。
    • 特徴: この道は、円周上の回転や、ビリヤードの玉の動きと深く結びついています。数学的には「有理数(分数)で表せない数(無理数)」と関係しています。

3. 第二章:3 文字以上の世界への挑戦

次に、標識が 1, 2, 3 と増えた世界(3 文字以上)を考えます。

  • 問題点:
    2 文字の世界では「ループしない=面白い」と言えましたが、3 文字以上になると、ただ「ループしない」だけでは不十分です。
    例え話で言うと、1, 2, 3 がランダムに並んでいるように見えても、実は 12 だけが活躍し、3 はたまにしか出てこないような「偏った道」は、本質的には 2 文字の道と変わらない「つまらない道」です。

  • 新しい条件:「有理独立(Rational Independence)」
    面白い道を見つけるための新しい条件は、**「各文字(1, 2, 3...)が現れる割合(頻度)が、お互いに『分数の関係』で結びついていないこと」**です。

    • 例え: 1 が 1/2 回、2 が 1/2 回なら、これは「1:1」の単純な関係です。でも、1 が「黄金比の逆数」の割合で現れ、2 が別の無理数の割合で現れるなら、それらは「独立」しています。
    • この「独立した割合」を持つ道こそが、真に「面白い道」です。
  • ティデマンの定理(1999 年):
    この「独立した割合」を持つ道において、「最も景色が少ない(最も単純な)道」の複雑さは、(d-1) × n + 1 であると証明されました。

    • 2 文字(d=2)なら n+1
    • 3 文字(d=3)なら 2n+1
    • 4 文字(d=4)なら 3n+1
      文字が増えるほど、最低限必要な「景色の種類」も増えるという、とても美しい法則です。

4. 第三章:新しい証明と「木」の発見

最後の章では、著者たちがティデマンの定理を、**「線形代数(行列)」**という新しい道具を使って、よりシンプルに証明し直しました。

  • フロー行列(Flow Matrix):
    道の上を流れる「文字の流れ」を、電気回路の電流のように考えました。
    「ある地点に流入する電流」と「流出する電流」のバランス(キルヒホッフの法則)を行列で表し、その「核(Kernel)」を調べることで、複雑さの限界を導き出しました。

  • 重要な発見:「木(Dendric)」
    この証明から、**「最も単純な道は、必ず『木(Tree)』のような構造を持っている」**という新しい事実がわかりました。

    • 例え: 道が分岐する際、ループ(輪っか)を作らず、常に一本の木のように枝分かれしていく構造です。
    • これまで知られていた「ストルミアン語」やその仲間たち(アルヌックス・ラウジ語など)は、すべてこの「木」の構造を持っています。つまり、**「最も単純な道=木のような道」**であることが、3 文字以上の世界でも成り立つことが示されました。

まとめ:この論文が伝えたかったこと

  1. 無限の道には、驚くほど単純なルールがある。
    ランダムに見えても、実は「黄金比」や「無理数」のような数学的な美しさに基づいて作られている。
  2. 文字が増えると、単純さの基準も変わる。
    2 文字のときは「ループしない」だけでよかったが、3 文字以上では「文字の割合がバラバラ(独立)であること」が重要になる。
  3. 新しい証明で、その正体がわかった。
    複雑な道は、実は「木」のように枝分かれする構造をしており、それが「最も単純な道」の正体である。

この研究は、**「一見複雑に見える自然現象や情報処理の背後には、驚くほどシンプルで美しい数学的構造が隠れている」**というメッセージを、文字列という小さな世界を通じて伝えています。