Yuan3.0 Ultra: A Trillion-Parameter Enterprise-Oriented MoE LLM

本論文は、事前学習段階で専門家の剪定と再編成を行う「Layer-Adaptive Expert Pruning(LAEP)」アルゴリズムを提案し、これにより事前学習効率を 49% 向上させつつ総パラメータ数を 33.3% 削減した、企業向けタスクに特化した 10100 億パラメータの MoE 型大規模言語モデル「Yuan3.0 Ultra」を開発したことを報告しています。

YuanLab. ai, :, Shawn Wu, Jiangang Luo, Darcy Chen, Sean Wang, Louie Li, Allen Wang, Xudong Zhao, Tong Yu, Bach Li, Joseph Shen, Gawain Ma, Jasper Jia, Marcus Mao, Claire Wang, Hunter He, Carol Wang, Zera Zhang, Jason Wang, Chonly Shen, Leo Zhang, Logan Chen, Qasim Meng, James Gong, Daniel Zhao, Penn Zheng, Owen Zhu

公開日 2026-03-06
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

超巨大な「賢いチーム」を効率化する方法:Yuan3.0 Ultra の仕組みをわかりやすく解説

この論文は、**「Yuan3.0 Ultra(ユアン 3.0 ウルトラ)」**という、非常に賢い AI(人工知能)の新しい作り方を紹介しています。

この AI は、企業での業務(書類の分析、複雑なデータの読み取り、チャットボットなど)に特化して作られていますが、一般的な会話や知識も得意です。

この AI の最大の特徴は、**「無駄な部分を事前に切り捨てて、チーム全体を劇的に効率化した」**という点にあります。これを「LAEP(レイヤー適応型エキスパート剪定)」という新しい技術で実現しました。

以下に、専門用語を使わず、日常の例えを使って解説します。


1. 従来の問題点:「大人数の会議」の悲劇

これまでの巨大な AI(MoE:混合エキスパートモデル)は、**「1 万人の専門家がいる巨大な会議室」**のようなものでした。

  • 仕組み: 質問が来ると、AI はその中から「2 人」だけを選んで回答を作ります。
  • 問題: 1 万人全員が常に準備をして待機しているため、メモリ(記憶容量)を大量に消費します。
  • さらに悪いこと: 訓練(勉強)をしている間、一部の「有能な専門家」だけが忙しく働いていて、他の多くの専門家は**「暇で何もしていない」**状態でした。
    • これでは、**「1 万人分の給料を払って、実際に働いているのは 2 人だけ」**という、非常に非効率な状態です。

2. 新技術「LAEP」:「朝礼での役割分担」の再編

Yuan3.0 Ultra は、この「1 万人の会議」を、**「1 万人から 6,700 人(33% 削減)に減らしつつ、さらに速く、賢くする」**という大胆な実験を行いました。

そのための新技術「LAEP」は、以下のような 2 つのステップで行われます。

ステップ①:「誰が本当に働いているか」を記録する(剪定)

AI が勉強(トレーニング)を始めて少し経つと、誰がどのくらい使われているかが見えてきます。

  • アナロジー: 新入社員研修で、誰が活発に発言し、誰がずっと黙っているかを見守ります。
  • 行動: 「ほとんど使われていない(暇な)専門家」をリストアップし、「この人はもう不要だ」と判断してチームから外します
  • 効果: 人数が減ることで、必要なメモリや計算資源が大幅に減ります。

ステップ②:「残った人」を公平に配置する(再配置)

ただ人を減らすだけでは、残った人たちが偏って忙しくなってしまう可能性があります。

  • アナロジー: 残った 6,700 人の専門家たちを、「忙しそうな人」と「少し暇な人」が混ざるように、複数の部屋(コンピューター)に公平に振り分けます
  • 行動: 特定の部屋だけがパンクして、他の部屋が暇という状態を防ぎます。
  • 効果: 全員が均等に働けるようになり、処理速度が劇的に向上します。

結果:

  • 人数(パラメータ数)が 33% 減 しました。
  • 勉強(トレーニング)の効率が 49% 向上 しました。
  • なのに、賢さ(精度)は落ちませんでした。むしろ、特定の業務では世界最高レベルになりました。

3. 「考えすぎ」を防ぐ魔法:RIRM

Yuan3.0 Ultra は、ビジネスの現場で使うために、もう一つ重要な工夫をしています。

  • 問題: 難しい数学や論理パズルを解くとき、AI は「答えを出す前に、10 回も 20 回も頭の中で考え直す(リフレクション)」癖がありました。
    • アナロジー: 料理を作る際、「卵を割る前に、卵の殻の成分を 10 回分析して、割る角度を 20 回シミュレーションする」ようなものです。正解にはなっても、時間とエネルギーの無駄です。
  • 解決策(RIRM): 「考えすぎ」を罰し、「素早く正解する」ことを褒めるルールを導入しました。
    • 効果: 答えまでの時間が短くなり、「無駄な思考」が 14% 減りました。でも、正解率は 16% 向上しました。
    • 結果: 「考えすぎ」をせず、**「さっと正解する」**賢い AI になりました。

4. 実際の成果:ビジネスの現場で最強

この AI は、一般的な会話だけでなく、**「企業の難しい仕事」**で驚異的な成績を残しています。

  • 書類の読み取り(Docmatix): 複雑な図表や画像が含まれた長い書類から、必要な情報を瞬時に見つけ出し、正解します。
  • チャット検索(ChatRAG): 長い会話履歴や大量のデータから、正確な答えを引き出します。
  • 表の理解(MMTab): 複雑な表(エクセルのようなもの)を読み解き、質問に答えます。
  • 要約(SummEval): 長い文章を、重要な点だけを残して短くまとめます。

これらすべての分野で、他の有名な AI(GPT-5 や Kimi など)を凌駕する、あるいは同等以上の性能を示しました。


まとめ

Yuan3.0 Ultra は、**「巨大なチームを、無駄なメンバーを整理し、役割を再配分することで、より小さく、より速く、より賢くした」**という画期的な AI です。

  • 従来の AI: 「1 万人の専門家がいるが、大半は暇で、計算リソースを浪費している」
  • Yuan3.0 Ultra: 「必要な 6,700 人に絞り、全員が公平に働き、無駄な思考もせず、ビジネスの現場で即戦力となる」

この技術は、AI をより安く、より速く、より実用的なものにする未来への大きな一歩と言えます。