Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

この論文は、ブロックチェーンプロトコルと疎な最適化手法(SparseLoCo)を活用して、許可不要な参加者による大規模な分散学習を実現し、1.1 兆トークンで前処理された 72B パラメータの言語モデル「Covenant-72B」を開発し、その性能が中央集権的なモデルと競合するレベルであることを示したものである。

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare

公開日 Tue, 10 Ma
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

「Covenant-72B」の物語:世界中の誰とでも一緒に巨大な AI を作る実験

この論文は、**「Covenant-72B(コーヴェナント -72B)」**という、非常に大きな人工知能(AI)モデルを、世界中の誰にでも参加できる形で作り上げた実験について書かれています。

通常、巨大な AI を作るには、Google や Meta のような巨大企業が、何千もの高性能なコンピューターを並べた「巨大なデータセンター」を建て、莫大な費用をかけて行います。しかし、このプロジェクトは**「信頼できない見知らぬ人」が、自宅のコンピューターや普通のインターネット回線を使って、世界中から集まった計算能力を寄せ集めて AI を作った**という点で画期的です。

これをわかりやすく、3 つのメタファー(たとえ話)で説明します。


1. 「巨大なパズル」を完成させる方法

(従来の方法 vs 新しい方法)

  • 従来の方法(中央集権型):
    巨大なパズル(AI)を完成させるために、1 人の天才が、何千ものピースを一度に並べられる「巨大な作業台(データセンター)」を用意します。全員が同じテーブルで、一瞬一瞬の動きを同期させながら作業します。これは速いですが、作業台を買うお金と場所が莫大にかかり、参加できるのは選ばれた一部の人だけです。

  • Covenant-72B の方法(分散型):
    世界中の何十人もの人々が、それぞれの家の机でパズルの一部分を解きます。彼らは「見知らぬ人」同士で、お互いのことを信頼していません。

    • 工夫: 全員が同時に連絡を取り合うと、インターネットがパンクしてしまいます。そこで、彼らは**「完成したパズルの一部だけ(圧縮された情報)」**を、非常に小さく折りたたんで(圧縮して)、お互いに送ります。
    • 結果: 1 人の天才が巨大なテーブルでやるのと同じくらい、素晴らしいパズル(720 億パラメータの AI)が完成しました。

2. 「泥棒と警備員」のゲーム

(なぜ「信頼できない人」でも大丈夫なのか?)

「見知らぬ人が参加して、嘘をついたり、間違った答えを送ったりしたらどうする?」という心配があります。これに対処するために、**「Gauntlet(ガントレット)」**という仕組みが使われました。

  • たとえ話:
    Imagine 100 人が「料理コンテスト」に出場しているとしましょう。
    • 参加者: 誰でも参加できますが、中には「ただの嘘つき」や「サボり屋」がいるかもしれません。
    • 審査員(Gauntlet): 料理の出来栄えを瞬時にチェックする AI 審査員がいます。
    • 仕組み: 審査員は、参加者が送ってきた「料理(学習データ)」を少しだけ食べて(検証して)、本物かどうか、美味しいかどうかを判定します。
      • 本物で美味しい料理を送った人 → ポイントがもらえる(報酬)。
      • 嘘をついたり、変な料理を送った人 → 失格(ポイントなし)。
    • 効果: 「正直に頑張れば報われる」というルールがあるため、見知らぬ人同士でも、誰もが悪さをしようとしません。結果として、世界中の誰にでも参加できる「民主的な」AI 作りが可能になりました。

3. 「重い荷物を運ぶ」工夫

(通信効率の良さ)

世界中のコンピューターをインターネットでつなぐと、通信速度が遅く、データを送るのに時間がかかります。これを「重い荷物を運ぶ」ことに例えます。

  • 問題: 通常、AI の学習では「荷物の重さ(データ)」をすべて送らなければなりません。しかし、インターネット回線では、この荷物を運ぶのに何時間もかかってしまいます。
  • Covenant-72B の解決策(SparseLoCo):
    • 荷物の圧縮: 彼らは「荷物の 99% は捨てて、1% だけ(重要な部分だけ)を送る」ことにしました。これを「スパース(疎)な情報」と呼びます。
    • 誤差のメモ帳: 「捨てた 99% の情報」は完全に消すのではなく、「メモ帳(エラーフィードバック)」に記録しておきます。次の回で、そのメモ帳の内容を少しだけ足して補正します。
    • 結果: 重い荷物を一度に運ぶのではなく、**「必要なものだけ、軽やかに何度も往復させる」**ことで、通信の遅さをカバーし、驚くほど速く学習を進めることができました。

この実験のすごいところ

  1. 規模の大きさ: これまで「インターネット越しに分散して学習させた AI」は、せいぜい小さなもの(100 億パラメータ程度)でした。しかし、Covenant-72B は720 億パラメータという、巨大なモデルを成功させました。
  2. 性能: 中央集権的なデータセンターで、何千台の高性能コンピューターを使って作られた AI と比べても、負けていません。むしろ、多くのテストで同等か、それ以上の性能を出しています。
  3. 民主化: 「お金持ちの企業しか作れない AI」から、「世界中の誰にでも参加できる AI」への第一歩となりました。

まとめ

この論文は、**「信頼できない見知らぬ人同士が、インターネットという狭い道を使って、巨大な AI を一緒に作れる」**ことを証明しました。

まるで、世界中の何万人もの人が、それぞれの家のパソコンで「小さなパズル」を解き、それを小さな紙片にまとめて送り合い、最終的に一つの巨大な絵を完成させたようなものです。これにより、AI 開発の未来は、特定の巨大企業だけでなく、世界中の誰でも参加できる「民主的なもの」になる可能性があります。