The AetherFloat Family: Block-Scale-Free Quad-Radix Floating-Point Architectures for AI Accelerators

Each language version is independently generated for its own context, not a direct translation.

この論文は、AI（人工知能）を動かすための「新しい計算のルール」を提案するものです。

今の AI は、計算の基礎として「IEEE 754」という長年使われているルール（浮動小数点数）を使っています。しかし、このルールは昔の汎用コンピューター向けに作られたもので、現代の「超高速・大規模な AI 専用チップ」にとっては、**「重くて、遅く、無駄が多い」**という問題がありました。

そこで、著者の Keita Morisaki さんは、AI 用に特化した新しい計算方式**「AetherFloat（エーテルフロート）」**を考案しました。

これをわかりやすく説明するために、いくつかの比喩を使ってみましょう。

1. 今のルール（IEEE 754）の問題点：「複雑な翻訳と隠し事」

今の AI 計算は、以下のような面倒なことをしています。

隠し事（隠された先頭ビット）:
数字の「1」を毎回書かずに「省略していいよ」というルールです。これにより、計算機は「あ、これは省略された 1 だな」と毎回推測して復元する必要があります。
- 比喩: 料理をする際、「塩」は毎回書かなくていいけど、料理人は「あ、ここには塩が入ってるはずだ」と毎回頭の中で想像して、塩を振りかける必要があります。これは時間とエネルギーの無駄です。
2 進数の厳格さ:
数字を並べる際、2 進数（2 の倍数）で厳密に揃える必要があります。
- 比喩: 荷物をトラックに積む際、箱のサイズが「2 倍、4 倍、8 倍」しか許されず、少しでもサイズが違えば、トラックの隙間を埋めるために複雑なパズル（ハードウェアの回路）を組まなければなりません。
ブロックスケーリング（AMAX）の必要性:
最近の AI（大規模言語モデル）は、計算中に「とんでもなく大きな数字」や「とんでもなく小さな数字」が突然出てくることがあります。今の 8 ビットという狭い箱では、これらが溢れて破綻してしまうため、**「一番大きな数字を探して、全体を縮小する」という追加の作業（AMAX）**を毎回行わなければなりません。
- 比喩: 小さなバケツで川の水を汲もうとしていますが、突然大きな波（大きな数字）が来ると溢れてしまいます。だから、毎回「一番高い波を測って、バケツの容量に合わせて水を薄める」という面倒な作業をしないといけません。

2. 新しいルール「AetherFloat」の解決策：「シンプルで、素直な箱」

AetherFloat は、AI の計算をよりシンプルにするために、以下の 3 つの工夫をしました。

① 「隠し事」をなくす（明示的な仮数）

「1」を省略せず、すべて書き込みます。

比喩: 料理人は「塩」を毎回書くようにしました。推測する必要がないので、「塩を振る動作」が単純になり、スピードが上がり、エネルギーも節約できます。
- 効果: 計算チップの面積が約 33% 減り、消費電力も約 22% 減りました。

② 「4 進数」でスケールする（Quad-Radix）

2 進数（2 の倍数）ではなく、4 進数（4 の倍数）で数字の大きさを表現します。

比喩: 荷物の箱のサイズを「2 倍、4 倍、8 倍」ではなく、「4 倍、16 倍、64 倍」にします。
- メリット: 4 倍ずつ大きくなるので、「大きな数字（波）」を吸収する箱の容量が格段に広がります。 これにより、特別な「波の測定器（AMAX）」が不要になります。
- デメリット: 箱のサイズが飛び飛びになるため、細かい数字の精度が少し落ちる可能性があります（「揺らぎ」）。しかし、AI の学習（確率的な勾配降下）には、この「揺らぎ」が逆に良い影響（正則化）を与えることが実験で確認されました。

③ 「整数」のように比較できる（辞書式順序）

今のルールでは、負の数字と正の数字の大小関係がバラバラで、特別な回路が必要です。AetherFloat は、負の数字も正の数字も、「整数の並び順」のまま扱えるようにしました。

比喩: 数字を並べる際、特別な辞書がなくても、ただの「数字の大小」でそのまま並べられます。
- 効果: AI でよく使う「0 より大きい方だけ残す（ReLU）」などの処理が、非常に安価な「整数計算回路」だけで瞬時に終わります。

3. 「ブロック・スケール・フリー」って何？

これがこの論文の最大の売りです。

今の AI（FP8 など）: 計算するたびに「一番大きな数字を探して、全体を調整する」ハードウェアが必要です。これは**「毎回、トラックの荷物を再整理する」**ようなものです。
AetherFloat（AF8）: 箱（ダイナミックレンジ）が最初から広すぎるので、「再整理（AMAX）」が全く不要です。
- 結果: 余計な回路が不要になり、チップが小さく、速く、省エネになります。

4. 注意点：使い方のルールが変わります

新しい車（AetherFloat）は素晴らしいですが、「運転の練習（学習）」のやり方を変える必要があります。

今のやり方（PTQ）: 完成されたモデルを、そのまま 8 ビットに縮小するだけ。これだと AetherFloat はうまく動きません（小さな数字がゼロになって消えてしまうため）。
新しいやり方（QAT）: 学習の段階から「8 ビットで計算するつもり」でモデルを育てます（Quantization-Aware Training）。
- 比喩: 普通の車（bfloat16）は、いきなりオフロード（8 ビット）でも走れますが、AetherFloat は「オフロード走行を想定して最初から練習（学習）させた車」でないと、その性能を発揮できません。

まとめ

この論文は、**「AI 専用の計算ルールを、ゼロから作り直した」**という提案です。

隠し事をなくしてシンプルにし、
4 進数を使って大きな数字を吸収しやすくし、
特別な調整回路を不要にしました。

その代わり、**「学習の段階でそのルールに慣れさせる（QAT）」**という手間が必要になりますが、その見返りとして、チップは小さく、速く、省エネになります。AI 業界が「より安く、より速く」AI を動かすための、画期的な「新しい土台」の提案と言えます。

The AetherFloat Family: Block-Scale-Free Quad-Radix Floating-Point Architectures for AI Accelerators

1. 今のルール（IEEE 754）の問題点：「複雑な翻訳と隠し事」

2. 新しいルール「AetherFloat」の解決策：「シンプルで、素直な箱」

① 「隠し事」をなくす（明示的な仮数）

② 「4 進数」でスケールする（Quad-Radix）

③ 「整数」のように比較できる（辞書式順序）

3. 「ブロック・スケール・フリー」って何？

4. 注意点：使い方のルールが変わります

まとめ

AetherFloat ファミリア：AI アクセラレータ向けブロックスケーリング不要なブロックスケールフリー・クアッドラディックス浮動小数点アーキテクチャ

1. 背景と課題 (Problem)

2. 提案手法とアーキテクチャ (Methodology)

A. 辞書的 1 の補数アンパッキング (Lexicographic One's Complement Unpacking)

B. クアッドラディックス（Base-4）スケーリング

C. 明示的仮数と統一データパス (Explicit Mantissa & Unified Datapath)

3. 主要な貢献とフォーマット (Key Contributions)

AetherFloat-8 (AF8): ブロックスケーリング不要な推論フォーマット

AetherFloat-16 (AF16): bfloat16 の代替

ベクター共有型確率的丸め (Vector-Shared Stochastic Rounding)

4. 評価結果 (Results)

ハードウェア性能 (SkyWater 130nm PDK 合成)

ソフトウェア/アルゴリズム評価 (Qwen2.5-7B モデル)

5. 意義と結論 (Significance)

The AetherFloat Family: Block-Scale-Free Quad-Radix Floating-Point Architectures for AI Accelerators

1. 今のルール（IEEE 754）の問題点：「複雑な翻訳と隠し事」

2. 新しいルール「AetherFloat」の解決策：「シンプルで、素直な箱」

① 「隠し事」をなくす（明示的な仮数）

② 「4 進数」でスケールする（Quad-Radix）

③ 「整数」のように比較できる（辞書式順序）

3. 「ブロック・スケール・フリー」って何？

4. 注意点：使い方のルールが変わります

まとめ

AetherFloat ファミリア：AI アクセラレータ向けブロックスケーリング不要なブロックスケールフリー・クアッドラディックス浮動小数点アーキテクチャ

1. 背景と課題 (Problem)

2. 提案手法とアーキテクチャ (Methodology)

A. 辞書的 1 の補数アンパッキング (Lexicographic One's Complement Unpacking)

B. クアッドラディックス（Base-4）スケーリング

C. 明示的仮数と統一データパス (Explicit Mantissa & Unified Datapath)

3. 主要な貢献とフォーマット (Key Contributions)

AetherFloat-8 (AF8): ブロックスケーリング不要な推論フォーマット

AetherFloat-16 (AF16): bfloat16 の代替

ベクター共有型確率的丸め (Vector-Shared Stochastic Rounding)

4. 評価結果 (Results)

ハードウェア性能 (SkyWater 130nm PDK 合成)

ソフトウェア/アルゴリズム評価 (Qwen2.5-7B モデル)

5. 意義と結論 (Significance)

関連論文

XConv: Low-memory stochastic backpropagation for convolutional layers

A Survey on Decentralized Federated Learning

Polynomially Over-Parameterized Convolutional Neural Networks Contain Structured Strong Winning Lottery Tickets

Provable Filter for Real-world Graph Clustering

Enhancing Computational Efficiency in Multiscale Systems Using Deep Learning of Coordinates and Flow Maps