LEDOM: Reverse Language Model

本論文では、未来の文脈から過去を予測する「LEDOM」と呼ばれる右から左への方向で訓練された大規模言語モデルを開発し、それが推論や質問生成などの独自の能力を習得すること、および前方モデルと逆方向モデルの確率を組み合わせる「Reverse Reward」手法により、数学的推論タスクでのハルシネーションを抑制し性能を大幅に向上させることを示しています。

Xunjian Yin, Sitao Cheng, Yuxi Xie, Xinyu Hu, Li Lin, Xinyi Wang, Liangming Pan, William Yang Wang, Xiaojun Wan

公開日 2026-03-04
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文は、**「LEDOM(レドム)」**という新しいタイプの AI について書かれています。

通常、AI は「左から右へ」文章を読むように訓練されています(例:「猫が」「走った」のように、前の言葉から次の言葉を予測する)。しかし、LEDOM は**「右から左へ」**文章を読むように訓練された、世界初の巨大な AI です。

これをわかりやすく説明するために、いくつかの面白い例えを使ってみましょう。

1. 通常の AI と LEDOM の違い:「物語の書き手」と「探偵」

  • 通常の AI(左→右):
    これは**「物語の書き手」**です。「昨日は天気が良かった。だから私は公園へ…」と、前の出来事から次の出来事を予測して物語を作ります。これはとても得意ですが、結果から原因を逆算するのは少し苦手なことがあります。
  • LEDOM(右→左):
    これは**「天才的な探偵」です。「犯人は A さんだった!」という結論(結果)を先に知っていて、「じゃあ、どうして A さんが犯人だとわかったんだろう?」と過去(原因)**を遡って推理します。

2. LEDOM が得意なこと:「逆算の魔法」

この「右から左」の訓練のおかげで、LEDOM は通常の AI にはない驚くべき能力を持っています。

  • 結果から理由を作る(帰納的推論):
    「マイクが会社を辞めた」という結果だけ与えられても、LEDOM は「彼は学生時代から働き詰めだったし、家族の期待も重かった…」と、その結果に至る説得力のあるストーリーを逆から作り上げることができます。
  • 「答え」から「問題」を作る:
    「答えは 21 です」と言われると、「では、その答えになる問題は何だろう?」と、問題文を逆算して生成できます。これは通常の AI には難しいことです。
  • 「逆転の呪い」を解く:
    通常の AI は「A は B の父だ」と教えても、「B は A の子だ」という逆の関係を理解するのが苦手です(これを「逆転の呪い」と呼びます)。しかし、LEDOM は右から左に読むため、「B は A の子だ」という関係を自然に理解してしまいます。

3. 最大の活用法:「二重チェック」で嘘を見抜く

この論文の一番の発見は、「書き手(通常の AI)」と「探偵(LEDOM)」を組ませると、AI の間違い(ハルシネーション)を劇的に減らせるという点です。

【例え話:料理の味見】

  • 通常の AI(シェフ): 美味しい料理を作ろうとしてレシピ(答え)を考えます。でも、たまに「材料が足りないのに、美味しい味が出た!」という嘘のレシピを作ってしまうことがあります。
  • LEDOM(味見名人): 出来上がった料理(答え)を見て、「えっ、この味なら、元々の材料(質問)はこれじゃないはずだ!」と逆からチェックします。

「Reverse Reward(逆リワード)」という仕組み:
論文では、この 2 人を組み合わせて、**「シェフが作ったレシピが、味見名人の逆チェックにパスするか」**を確認するシステムを作りました。

  • もしシェフが嘘をついていれば、味見名人は「この味から元の材料を逆算すると、矛盾する!」と気づきます。
  • この「矛盾」を検知して、嘘のレシピを捨て、正しいレシピを選ぶことで、数学の問題を解く正解率が最大 15% も向上しました。

4. 弱点と注意点

もちろん、LEDOM にも弱点があります。

  • コードを書くのは苦手: プログラムは「左から右」に順番に書く必要があるため、右から左に読む LEDOM はコード生成が苦手です。
  • 安全性のリスク: 通常の AI は「危険なことを教えない」というフィルターがありますが、LEDOM はそのフィルターが効かない場合があり、危険な内容(薬の作り方など)を逆から生成してしまうリスクがあります。

まとめ

この論文は、**「AI も右から左に読ませると、全く新しい『逆思考』の能力が生まれる」**ことを示しました。

  • 通常の AIは「未来を予測する」のが得意。
  • LEDOMは「過去を推理する」のが得意。

この 2 つを組み合わせることで、AI が嘘をつかずに、より正確に、論理的に考えることができるようになります。まるで、「未来を予言する占い師」と「過去を解明する探偵」がチームを組んで、真実を見極めるようなイメージです。

この技術は、特に数学や論理パズルのような「正解が一つしかない問題」において、AI の精度を飛躍的に高める可能性を秘めています。