The Finite Primitive Basis Theorem for Computational Imaging: Formal Foundations of the OperatorGraph Representation

Each language version is independently generated for its own context, not a direct translation.

🏗️ 核心となるアイデア：「画像のレゴセット」

これまで、医療用 MRI、CT スキャン、天文写真、あるいは新幹線の検査装置など、「画像を作る装置」ごとに、全く別の専用ソフトウェア（コード）が作られていました。
「MRI のための計算方法」と「CT のための計算方法」はまるで違う言語を話しているようで、お互いの技術を共有するのが大変でした。

しかし、この論文の著者（楊成帥さん）は、**「実は、すべての画像装置は、たった 11 種類の『基本の動作（プリミティブ）』を組み合わせて作られている」**と証明しました。

これを**「有限プリミティブ基底定理」**と呼んでいます。

🧱 11 種類の「魔法のレゴブロック」

すべての画像生成プロセスは、以下の 11 種類のブロックを順番に並べるだけで説明できます。

**伝播 **(Propagate)：光や音が空間を移動する（例：カメラのレンズを通る光）。
**変調 **(Modulate)：物体が光や音を遮ったり、色を変えたりする（例：X 線が骨に吸収される）。
**投影 **(Project)：3 次元の物体を 2 次元の影のように写し取る（例：CT スキャンの断面図）。
**符号化 **(Encode)：情報を周波数やパターンに変える（例：MRI の磁気パルス）。
**畳み込み **(Convolve)：画像が少しぼやける現象（例：カメラのピントが甘くなる）。
**集積 **(Accumulate)：時間をかけて光や音を足し合わせる（例：長時間露光）。
**検出 **(Detect)：光や音を「電気信号（写真）」に変える（例：カメラのセンサー）。
**サンプリング **(Sample)：情報の一部だけを取り出す（例：圧縮されたデータ）。
**分散 **(Disperse)：光を虹のように色ごとに分ける（例：プリズム）。
**散乱 **(Scatter)：粒子がぶつかって方向やエネルギーを変える（例：レントゲンが体内で跳ね返る）。
**変換 **(Transform)：非線形な変化（例：光が強いとセンサーが飽和する、または X 線が骨を通過する際のエネルギー変化）。

🎭 例え話：「料理のレシピ」と「食材」

この理論を料理に例えてみましょう。

これまでの考え方：
「寿司屋のレシピ」「イタリアン料理のレシピ」「中華料理のレシピ」は、それぞれ全く別の本に書かれていて、共通項が見つかりませんでした。
この論文の発見：
「実は、世界中のどんな料理も、『切る』『炒める』『煮る』『蒸す』などたった 11 種類の『調理法』の組み合わせで説明できるよ！」と証明しました。
- 寿司も、パスタも、カレーも、この 11 種類の調理法を順番に並べるだけで作れます。
- さらに、「この 11 種類は全部必要だよ。どれか 1 つでも抜くと、特定の料理（例：散乱ブロックがないと、跳ね返る現象を表現できない）とも証明しました。

🚀 なぜこれがすごいのか？

1. 「万能の翻訳機」ができる

これまでは、MRI のデータを CT のアルゴリズムで処理するのは難しかったですが、この「11 個のブロック」の言語（OperatorGraph）を使えば、どんな画像装置のデータも同じ土俵で扱えるようになります。

メリット：新しい画像技術を開発する際、ゼロから考え直す必要がなくなります。「既存のブロックをどう組み合わせるか」だけを考えれば OK です。

2. 「複雑な非線形現象」もシンプルに

画像処理には「光が強いと飽和する」や「波が複雑に干渉する」といった、数学的に難しい現象（非線形）があります。

この論文は、**「どんなに複雑な非線形現象も、実は『点ごとの単純な変換』か『繰り返しの計算』の 2 種類に分類できる」**と突き止めました。
つまり、複雑怪奇に見える物理現象も、実はレゴブロックの組み合わせでシンプルに説明できるのです。

3. 未来の AI への布石

著者はこの理論を「物理世界モデル（Physics World Models）」の基礎としています。

AI が画像を学習する際、この「11 個のブロック」の構造を事前に知っていることで、少ないデータでも正確に学習できるようになります。まるで、料理の基礎知識（切る・炒める）を知っている人が、新しいレシピをすぐにマスターできるのと同じです。

📊 実証実験：本当に 11 個で足りるの？

著者は、31 種類の異なる画像技術（MRI、CT、光干渉断層計など）と、9 種類の複雑な非線形現象をテストしました。

結果：すべてのケースで、11 個のブロックを最大 5 つまで並べるだけで、元の物理現象を 99% 以上（誤差 1% 未満）の精度で再現できました。
さらに、**「散乱（Scatter）」**というブロックが見つかるまで、コンプトン散乱（X 線が体内で跳ね返る現象）を正確に表現できませんでした。これが見つかったことで、すべてのブロックが揃い、理論が完成しました。

💡 まとめ

この論文は、**「宇宙の画像を作る仕組みは、たった 11 種類の『物理のレゴブロック』でできている」**という、シンプルで強力なルールを数学的に証明しました。

これにより、医療、科学、産業のすべての画像技術が、**「共通の言語」**で話せるようになります。

新しい画像装置を開発するエンジニアは、**「どのブロックをどう組み合わせるか」**という設計図を描くだけで済みます。
AI は、**「このブロックの組み合わせなら、どんな画像も理解できる」**という強力な武器を手に入れます。

まるで、世界中のあらゆる建物が「レンガ、木材、ガラス、鉄骨」などの限られた素材で建てられていることを発見したような、画期的な成果です。

Each language version is independently generated for its own context, not a direct translation.

この論文「Computational Imaging における有限原始基底定理：OperatorGraph 表現の形式的基礎」は、計算イメージングの前方モデル（Forward Model）を、物理法則に基づいた 11 種類の「原始（Primitive）」からなる有向非巡回グラフ（DAG）として体系的に表現・分解できることを数学的に証明した画期的な研究です。

以下に、問題定義、手法、主要な貢献、結果、そして意義について詳細な技術的サマリーを記述します。

1. 背景と問題定義

計算イメージング（Coded Aperture 分光カメラから MRI スキャナーまで）の前方モデルは、従来、モダリティごとに個別に実装されたモノリシックなコードとして存在していました。これにより、異なるモダリティ間で診断ツール、較正アルゴリズム、再構成パイプラインを共有することが困難でした。
既存のライブラリ（ODL, MIRT, SigPy など）は特定のドメインに特化しており、すべてのイメージングモダリティを網羅する「有限かつ普遍的な演算子分解」の理論的根拠は欠けていました。
本研究の核心課題： すべての臨床、科学、産業用イメージングモダリティ（線形・非線形を問わず）を、極めて少数の物理演算子の組み合わせとして形式的に表現できるか、そしてその最小集合は何か。

2. 手法と理論的枠組み

2.1 演算子クラス $\mathcal{C}_{img}$ の定義

著者は、すべてのイメージング前方モデル $H$ が属する演算子クラス $\mathcal{C}_{img}$ を厳密に定義しました。

構造: 有限の直列・並列合成（または DAG 構造）として記述可能。
正則性: 各段階は有界な線形演算子か、リプシッツ連続な点ごとの非線形関数のいずれか。
範囲: 量子状態トモグラフィ（密度行列のベクトル化）や相対論的領域（相対論的断面積を含む）も含まれます。

2.2 有限原始基底定理 (Finite Primitive Basis Theorem)

すべての $H \in \mathcal{C}_{img}$ は、以下の**11 種類の標準的な原始（Canonical Primitives）**からなる有向非巡回グラフ（DAG）として、任意の精度 $\epsilon$ で近似表現可能であることを証明しました。

Propagate (P): 自由空間での波伝搬（角スペクトル法）。
Modulate (M): 変調パターンによる要素ごとの乗算（例：コイル感度、マスク）。
Project (Π): ラドン変換（線積分投影、CT など）。
Encode (F): フーリエ符号化（MRI の k 空間トラジェクトリ）。
Convolve (C): 空間畳み込み（PSF など）。
Accumulate (Σ): 軸方向の累積（スペクトル・時間積分）。
Detect (D): キャリア場から測定値への変換（5 つの標準応答ファミリー：線形、対数、シグモイド、強度二乗則、コヒーレント場）。
Sample (S): 部分集合の選択（アンダーサンプリング、ピクセルビンディング）。
Disperse (W): 波長依存の空間シフト（プリズム・回折格子分散）。
Scatter (R): 散乱（方向・エネルギー変化、コンプトン散乱など）。
Transform (Λ): 点ごとの非線形変換（ベール・ランベルト減衰、位相巻き込み、飽和など）。

2.3 証明の構成

構成性: 任意のモデル $H$ を 6 つの物理ステージ（伝搬、弾性相互作用、非弾性散乱、点ごとの非線形、符号化・投影、検出・読み出し）に分類し、それぞれを対応する原始（またはその有限合成）で実装するアルゴリズムを提供。
最小性の証明: 11 種類の原始のいずれかを削除すると、少なくとも 1 つのモダリティが $\epsilon$ -近似表現を失うことを示し、このライブラリが最小であることを証明（Proposition 31）。
非線形性の分類: イメージング物理におけるすべての非線形性は、「点ごとのスカラー関数（Transform による処理）」と「自己整合的な反復（Born 級数への展開による既存の線形原始の合成）」の 2 種類に帰着することを示しました。

3. 主要な結果

3.1 実証的検証

31 の線形モダリティ: CASSI, MRI, CT, 電子 Ptychography, 光音響イメージングなど、31 種類のモダリティに対して分解を実行。
- 結果: すべてで相対誤差 $e_{img} < 0.01$ を達成。
- 複雑性: 最大でも 5 つのノード、深さ 5 以内で表現可能。
9 の非線形モダリティ: 多色 CT（ビームハードニング）、位相巻き込み MRI、非線形超音波など。
- 結果: 既存の線形原始と Transform 原始、あるいは Born 級数の展開を用いて、同様に高精度な分解に成功。
ホールドアウトテスト: 事前に定義されたライブラリ（9 種）でテストし、コンプトン散乱（Compton scatter）のみが失敗（誤差 0.34）したため、Scatter (R) 原始を追加。これにより最終的に 11 種となり、すべてのテストモダリティが成功しました。

3.2 基底の飽和

モダリティが増加するにつれて必要となる原始の種類数は、最初の 7 つのモダリティで 9 種に達し、その後 11 種で飽和しました。新しい物理現象（例：相対論的断面積）は既存の原始の枠組み内で記述可能であり、新しい原始の追加は不要であることが示されました。

4. 意義とインパクト

物理世界モデル (Physics World Models) の数学的基盤:
この定理は、モダリティに依存しないイメージングフレームワーク（Yang and Yuan, 2026）の数学的基盤を確立しました。校正、再構成、診断アルゴリズムをグラフ構造上で動作させることで、あらゆるイメージングモダリティに適用可能になります。
計算イメージングの複雑性の有界化:
新しいモダリティが登場しても、根本的に新しい数学が必要になるわけではなく、既存の 11 種類の原始の組み合わせで表現できることが示されました。これにより、イメージングシステムの設計と解析が体系的に行えるようになります。
非線形性の構造的制約:
イメージング物理における非線形性は、点ごとの変換か、線形演算子の反復合成のいずれかに限定されるという驚くべき制約が発見されました。これは、深層学習などのブラックボックスモデルに依存せず、物理的に解釈可能なモデルを構築する強力な根拠となります。
拡張プロトコルの確立:
仮に新しい物理現象が発見された場合、厳密な基準（既存のライブラリでは $\epsilon$ -近似が不可能であることなど）に基づいて新しい原始を追加する体系的な手順（Extension Protocol）が提案されました。

結論

本論文は、計算イメージングの前方モデルを、11 種類の物理的に意味のある原始演算子からなる有向非巡回グラフ（DAG）として完全に分解可能であることを証明しました。これは、多様なイメージング技術を超えた統一された言語と理論的枠組みを提供し、将来の AI 駆動型イメージングシステムや物理ベースのモデル開発の基盤となる重要な成果です。