⚛️ phenomenology

OmniLearned: A Foundation Model Framework for All Tasks Involving Jet Physics

この論文は、10 億個以上のジェットを用いた大規模学習とアーキテクチャの刷新、およびオープンなソフトウェア提供により、トップクォーク・ジェットタグ付け、b タグ付け、異常検出など多様なタスクで最先端の性能を達成し、衝突型実験の発見可能性を大幅に拡大する「OmniLearned」フレームワークを提案しています。

原著者： Wahid Bhimji, Chris Harris, Vinicius Mikuni, Benjamin Nachman

公開日 2026-03-27

📖 1 分で読めます🧠 じっくり読む

CC BY 4.0

原著者： Wahid Bhimji, Chris Harris, Vinicius Mikuni, Benjamin Nachman

原論文は CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) でライセンスされています。 ✨ これは以下の論文のAI生成解説です。著者が執筆または承認したものではありません。技術的な正確性については原論文を参照してください。免責事項の全文を読む

この論文は、素粒子物理学（特に「ジェット」と呼ばれる粒子の塊）の分析において、**「万能な AI 教師」**のような存在を開発したという画期的な成果を報告しています。

専門用語を排し、日常の例え話を使って解説します。

1. 背景：なぜ「ジェット」の分析は難しいのか？

加速器（LHC など）では、素粒子を衝突させます。その結果、クォークやグルーオンという小さな粒子が飛び出し、すぐに「ジェット」と呼ばれる粒子の群れ（かたまり）になります。
このジェットを分析して、「これはトップクォークという特別な粒子から来たのか？」「それともただの背景ノイズ（QCD）なのか？」を見分けるのは、物理学者にとって重要な仕事です。

しかし、これまでこの仕事には大きな壁がありました。

問題点： 「トップクォークを見分ける AI」と「ボトムクォークを見分ける AI」など、タスクごとに AI をゼロから作らなければなりませんでした。
現実： 高品質なデータ（シミュレーション）を作るのは非常にコストが高く、時間がかかります。「新しいタスク」が出るたびに、またゼロから AI を育てる必要があったのです。

2. 解決策：OmniLearned（オムニラーンド）とは？

この論文で紹介されている**「OmniLearned」は、「すべてのジェットに関する知識を一度に学んだ、超優秀な基礎モデル（ファウンデーションモデル）」**です。

これを**「料理の天才シェフ」**に例えてみましょう。

以前のやり方（ゼロから作る）：
「寿司を作れる料理人」を育てるには、米から研ぎ始め、魚のさばき方から教える必要があります。「パスタを作れる料理人」も、パスタから教える必要があります。それぞれに時間と材料（データ）がかかります。
OmniLearned のやり方（基礎モデル）：
まず、**「10 億個以上の食材（ジェットデータ）」を使って、「万能な料理の基礎」**を学ばせた天才シェフを作りました。
このシェフは、米の炊き方、魚の扱い、スパイスの効かせ方など、あらゆる料理の「基本」をすでに熟知しています。

3. この研究の 3 つのすごい進化

この「万能シェフ（OmniLearned）」は、前のバージョン（OmniLearn）からさらに進化しました。

脳みその進化（アーキテクチャの更新）：
シェフの頭脳（AI の構造）をより賢く、柔軟なものにしました。特に、粒子同士の「距離」や「質量」などの物理的な関係性を、より深く理解できるように設計し直しました。
圧倒的な学習量（10 億個のデータ）：
前のモデルが 1 億個のデータで学んでいたのに対し、今回は10 億個ものデータで学習しました。これは、料理のレシピ本を 10 倍も読んだ状態です。これにより、どんな特殊な食材（新しい物理現象）に対しても、瞬時に適応できるようになりました。
誰でも使えるキット（オープンソース）：
単にモデルを作るだけでなく、**「誰でもこのシェフを呼び出せるようにする道具（ソフトウェア）」**も公開しました。これで、世界中の研究者がすぐにこの AI を自分の研究に使えるようになりました。

4. 何ができるようになったのか？（3 つの実験）

この「万能シェフ」が、実際に 3 つの異なる料理（タスク）をこなす様子を見せました。

実験①：トップクォークの発見（トップ・タグging）
- タスク： 「これはトップクォークという特別な粒子の塊か？」を見分ける。
- 結果： 既存の最高性能の AI を凌駕する精度を出しました。基礎を学んでいるので、少しの指示（微調整）だけで、即座にプロのレベルに達しました。
実験②：ボトムクォークの識別（b タグging）
- タスク： ATLAS 実験の実データを使って、ボトムクォークを識別する。
- 結果： 既存の最高技術（GN2）よりも、ノイズ（他の粒子）を排除する能力が大幅に向上しました。
- 面白い点： 本来は「粒子を生成する」ための機能を使って、「粒子のルーツ（どこから来たか）」を当てるタスクをこなしました。これは、シェフが「寿司のネタを作る技術」を使って、「パスタのソースの材料を特定する」ような、柔軟な応用です。
実験③：未知の現象の発見（異常検知）
- タスク： 「何か変なものが混じっていないか？」を探す。
- 結果： CMS 実験の実データ（未知のデータ）に、トップクォークという「既知の珍味」が 0.1% だけ混ざっている状態で、それを見事に発見しました。
- すごい点： これまで「新しい物理」を探すには、その現象に特化した AI を作るのが普通でしたが、OmniLearned は**「何も教えてあげなくても（微調整なしで）」**、基礎知識だけで「ここがおかしい！」と気づくことができました。

5. まとめ：なぜこれが重要なのか？

この研究は、**「素粒子物理学における AI の使い方が、ゼロから作る時代から、基礎モデルを活用する時代へ移行した」**ことを示しています。

効率化： 毎回ゼロから AI を育てる必要がなくなり、研究スピードが劇的に上がります。
発見の可能性： 「未知の現象（新しい物理）」を探す際、特定の現象に偏った学習をしていないため、予期せぬ発見がしやすくなります。

一言で言えば：
「これまでは、新しい料理を作るたびに新しい料理人を雇って教育していたが、今回は**『あらゆる料理の基礎を極めた天才シェフ』**を育て上げ、彼に少しの指示を出すだけで、どんな料理（物理現象の解析）も完璧にこなせるようになった」という画期的な成果です。

これにより、将来の加速器実験で、人類がまだ見たことのない「新しい物理」が見つかる可能性が、格段に高まりました。

論文要約：OmniLearned 基盤モデルフレームワーク

1. 背景と課題 (Problem)

高エネルギー物理学におけるハドロンジェット（クォークやグルーオンが生成する粒子の集団）の解析は、対撞機実験の核心です。過去数十年間、ジェットの特徴を記述するために物理的に着想を得た観測量が提案されてきましたが、近年は深層学習に基づくタグガー（識別器）が標準となっています。

しかし、以下の課題が存在しました：

データ不足: 多様なジェット関連タスク（トップクォーク識別、b クォークタグ、異常検知など）それぞれに対して、最先端の機械学習モデルを訓練するのに十分な量のラベル付きジェットデータを収集・準備することが困難である。
既存の基盤モデルの限界: 粒子物理学における既存の基盤モデル研究の多くは、大規模言語モデル（LLM）と同様のトークン化と自己教師あり学習に依存している。これらは有用な表現を学習するが、シミュレーションから得られるデータの連続性やラベル情報を十分に活用できていない。

2. 提案手法と方法論 (Methodology)

本研究は、以前の「OmniLearn」モデルを大幅にアップグレードした新しい基盤モデルフレームワーク**「OmniLearned」**を提案します。

A. モデルアーキテクチャの進化 (PET v2)

基盤となる Point Edge Transformer (PET) を「PET v2」へと改良しました。

入力特徴量: 各粒子の運動量情報に加え、対称性や物理的意味を持つ特徴量（ $\Delta\eta, \Delta\phi, \log p_T, \log E$ ）を最小限に絞り、前処理（標準化）を不要にしました。
追加情報のエンコーディング: 粒子識別（PID）や頂点情報（Vertex）などの追加情報を、ドロップアウト戦略を用いて柔軟に学習可能にしました。PID はトークン埋め込み、頂点情報は MLP でエンコードし、欠損時にはゼロ埋めします。
ローカル注意機構 (Local Attention): 粒子間の局所的な相関を捉えるため、物理的に着想を得た相互作用項（不変質量、距離、 $p_T$ の積など）をペア特徴量として導入し、単純な平均ではなく学習可能な重み付き平均（Transformer ブロック）を使用します。
グローバル注意機構 (Global Attention): 注意行列に物理的相互作用項をバイアスとして追加し、層正規化を学習可能な双曲正接関数に置き換えることで、安定性と表現力を向上させました。
タスク固有ヘッド: ジェット分類とジェネレーション（生成）の両方を同時に行うマルチタスク学習を行います。分類には 5 つの学習可能トークンを使用し、生成には拡散モデル（Diffusion Model）の枠組みを採用しました。

B. 損失関数の改良

分類タスク: 従来のラベル付き分類に加え、ラベルのない実験データ（真のラベルが存在しない場合）を扱うための「サンプル分類」タスクを追加し、損失関数に統合しました。
生成タスク: 従来の拡散モデル（Diffusion）から、より効率的な**フローマッチング（Flow Matching）**パラメータ化へ変更しました。これにより、ノイズからデータへの経路を速度場（velocity field）として予測し、生成の品質と収束速度を向上させました。

C. 大規模データセット (10 億ジェット)

OmniLearned の事前学習には、以下のオープンデータセットを統合した10 億個以上のジェットを使用しました。

構成: JetClass, JetClass2, Aspen Open Jets, ATLAS Top Tagging, H1 DIS, CMS QCD/BSM など。
規模: 合計 10 億 5700 万個のジェット、210 個のクラス（200 個のジェットフレーバー、10 個のデータセット固有クラス）。
特徴: 異なる対撞機（LHC, HERA）、異なる検出器シミュレーション（Delphes, Geant4, Geant3）、異なる生成器（Pythia, MadGraph など）から得られた多様なデータを統合し、汎用性の高い表現を学習させました。

3. 主要な貢献 (Key Contributions)

OmniLearned フレームワークの公開: アーキテクチャ、トレーニングコード、および 10 億ジェット規模の統合データセットへのアクセスを可能にするソフトウェアパッケージを提供。
PET v2 アーキテクチャの提案: 物理的制約をモデルに組み込んだ改良型トランスフォーマー。
大規模事前学習: ジェット物理学分野で初めて 10 億個規模のデータを用いた基盤モデルの事前学習を達成。
多様なタスクへの適用: 分類、タグging、異常検知など、異なるタスクに対して同一の基盤モデルを微調整（Fine-tuning）または直接使用可能であることを実証。

4. 結果 (Results)

OmniLearned は、3 つの代表的なタスクにおいて最先端（State-of-the-Art, SOTA）の性能を示しました。

A. ジェット分類 (Jet Classification)

トップクォークタグging: 共通ベンチマークデータセットにおいて、OmniLearned（特に Large モデル）は、既存の ResNeXt, ParticleNet, ParT などのモデルを上回る性能を達成しました。信号効率 30% 時の背景除去効率が大幅に向上しました。
クォーク/グルーオン識別: 同様に、従来モデルを凌駕する性能を示しました。
サイズスケーラビリティ: モデルサイズ（Small: 3M, Medium: 58M, Large: 460M 可学習パラメータ）が大きくなるほど、微調整後の性能が向上することが確認されました。

B. ATLAS フレーバータグging (b/c タグging)

ATLAS 公開シミュレーションデータを用いた b クォークおよび c クォークの識別において、ATLAS 協働が現在使用している最先端モデル「GN2」を上回る性能を達成しました。
特に、b タグging において軽ジェット（light-jet）の除去効率が 50% 以上向上し、 $\tau$ レプトン由来のジェットに対しても 2 倍の改善が見られました。
転用成功: 生成ヘッドを軌道（track）の起源分類タスクに転用することで、追加の補助タスクを通じて性能をさらに向上させることができました。

C. 異常検知 (Anomaly Detection)

CMS オープンデータへの適用: CMS 実験の 2016 年データを用いて、単一ジェットチャネルにおけるトップクォークの再発見（異常検知）を行いました。
手法:
1. Cathode 型アプローチ: 側帯域（signal region 以外）で事前学習済みモデルを微調整し、背景分布を生成・推定。信号領域での異常スコアを計算。
2. 直接アプローチ: 事前学習時に使用した「3 本構造（3-prong）」クラスと QCD クラスの比率を直接異常スコアとして使用（微調整不要）。
結果: 両手法とも、トップクォーク信号（データ全体の約 0.1%）を統計的に有意なレベルで検出することに成功しました。ゼロから訓練したモデルでは検出不可能だった信号を、OmniLearned は明確に検出しました。

5. 意義と展望 (Significance)

発見能力の拡大: 計算コストのかかる完全シミュレーションデータを大幅に削減しつつ、高品質なタグガーを構築可能にしました。これにより、過去・現在・将来の対撞機実験の発見能力が向上します。
汎用性の証明: 異なる検出器（ATLAS, CMS, H1）、異なるシミュレーション条件、異なる物理プロセス（標準模型および新物理）をまたいで、単一の基盤モデルが有効に機能することを示しました。
異常検知への新たな道筋: 微調整なしで事前学習済みモデルを直接異常検知に利用できる可能性を示し、未知の新物理探索の効率化に寄与します。
コミュニティへの貢献: 大規模データセットとコードの公開により、ジェット物理学における機械学習研究の再現性と発展を加速させます。

結論として、OmniLearned はジェット物理学における「基盤モデル」の概念を確立し、大規模データと物理的制約を融合させることで、従来の手法を凌駕する汎用的かつ高性能な解析フレームワークを提供しました。