Retrieval-Augmented Generation with Covariate Time Series

Each language version is independently generated for its own context, not a direct translation.

🛫 物語の舞台：航空機の「心臓」を守る戦い

航空機には「PRSOV（圧力調整・遮断弁）」という重要な部品があります。これはエンジンから出る空気の圧力を調整する「心臓の弁」のようなものです。

問題点： この部品が壊れると、飛行中にトラブルが起きたり、最悪の場合、飛行機が空港に留め置かれて（AOG）、何百万円もの損失が出たりします。
従来の方法： 「壊れてから直す」か、「壊れる直前に点検する」だけでした。でも、故障は突然起きるので、事前の予測は非常に難しかったのです。

🤖 従来の AI の失敗：「天才だが、経験不足な新人」

最近、大規模な AI（TSFM：時系列基盤モデル）が登場しました。これは「あらゆるデータを見て学習した天才」ですが、この特定の部品（PRSOV）の予測には失敗しました。

理由 1（データ不足）： 故障する瞬間はめったに起きません。AI が「学習」できるデータが少なすぎるのです。
理由 2（短い瞬間）： 故障の兆候は、たった18 個のデータ点（10 秒間）という、あまりにも短い瞬間に現れます。AI にとって、これほど短いデータからパターンを見つけるのは至難の業です。
理由 3（複雑な関係）： この弁の動きは、エンジン回転数や他の圧力など、**「外部の要因（共変量）」**に強く左右されます。AI は「弁の動きだけ」を見て予測しようとして、物理的な理屈を無視してしまいました。

✨ 新技術「RAG4CTS」の登場：「経験豊富なベテランのメモ帳」

そこで、著者たちは**「RAG4CTS（検索拡張生成）」という新しい仕組みを考え出しました。これは、AI 単独で考えるのではなく、「過去の膨大な記録（メモ帳）を参照しながら答える」**というアプローチです。

これを 3 つのポイントで説明します。

1. 完璧なメモ帳（階層的な知識ベース）

従来の AI は、過去のデータを「抽象的なベクトル（意味の断片）」に変換して保存していました。これだと、細かい数値のニュアンスが失われます。

新しい方法： 彼らは、**「生データ（Raw Data）」**をそのまま、木のような構造で保存しました。
アナロジー： 料理のレシピを「美味しそう」という言葉で覚えるのではなく、「材料のグラム数、温度、混ぜる時間」をすべて正確に記録した本を備え付けました。これにより、どんなに短い瞬間のデータも、欠かさず保存できます。

2. 「同じ状況」だけを厳密に探す（二段階の検索）

「過去の似たデータ」を探すとき、ただ「形が似ている」だけではダメです。

例：飛行機が離陸する時の圧力変化と、着陸時の圧力変化は、グラフの形が似ているかもしれません。でも、原因（エンジン回転数など）が違えば、未来の動きも全く違います。
新しい方法： AI は「形（トレンド）」だけでなく、**「原因（共変量）」**も厳密にチェックします。
- ステップ 1：形が似ているものを探す。
- ステップ 2：その形を作った「原因（エンジン回転数など）」も同じか確認する。
アナロジー： 犯人捜しで、単に「顔が似ている」人を探すのではなく、「犯行時刻と、その時の行動パターン」も一致する人だけをリストアップするようなものです。

3. AI 自身に「ベストな答え」を選ばせる（エージェント駆動）

過去のデータをどれくらい参照すればいいか？1 回分？5 回分？10 回分？

問題： 参照しすぎるとノイズ（雑音）が混入し、参照しなさすぎると情報が不足します。
新しい方法： AI は、**「一番似ている過去のデータ（トップ 1）」を「先生（エージェント）」*として使い、自分自身でテストします。「このデータを追加したら、予測が上手になるかな？」「追加しすぎたら悪化するかな？」と、自分自身で最適な参照数（k）を計算して決めます。
アナロジー： 料理をする際、「レシピを 1 冊見るか、3 冊見るか」を、その日の材料や天気を見て、料理人自身が「これくらいがベストだ」と判断する感じです。

🏆 結果：南航（チャイナ・サザン航空）での実証

このシステムは、中国南方航空（チャイナ・サザン航空）の飛行機で実際に使われています。

成果： 導入から 2 ヶ月で、**「1 機の飛行機で PRSOV の故障を正確に予知」**しました。
驚くべき点： 誤報（勘違いでアラートを出すこと）が 0 件でした。
意味： これまで「壊れてから直す」だったのが、「壊れる前に、必要な時にだけ修理する」ことができるようになりました。

📝 まとめ

この論文は、**「AI に『過去の生々しい経験（データ）』を参照させ、物理的な理屈（原因と結果）を厳密に守らせ、さらに AI 自身に『どのくらい参考にするか』を判断させる」**ことで、従来の AI が苦手としていた「データが少ない・瞬間が短い・複雑な工業データ」の予測を劇的に成功させたという話です。

まるで、**「新人の AI 助手に、ベテラン整備士の膨大なメモ帳と、その日の状況に合わせた判断力を与えた」**ようなものですね。これにより、航空機の安全性がさらに高まることが期待されています。

Each language version is independently generated for its own context, not a direct translation.

1. 背景と課題（Problem）

大規模言語モデル（LLM）の成功は時系列基盤モデル（TSFM）の開発を促しましたが、産業分野への適用には以下の根本的な課題が存在します。

データ不足と短い遷移シーケンス: PRSOV のような重要な制御局面は、1 回のフライトサイクルに 1 回しか発生せず、データが極めて少ない（Scarcity）です。また、そのデータは 10 秒間で 18 点程度という極めて短い遷移（Transient）シーケンスです。
共変量結合ダイナミクス: 目標変数（Manifold Pressure: MP）は、エンジン回転数（N2）や中間圧力（IP）といった外部の共変量によって物理的に駆動されています。これを無視して予測することは物理法則に反します。
既存手法の限界:
- 学習型アダプタの依存: 既存の RAG 手法（TimeRAF, TS-RAG など）は、コンテキストを埋め込むための学習可能なアダプタに依存していますが、データが少ない環境では収束せず、逆にデータ不足という問題に陥ります。
- 静的ベクトル化の歪み: 短い遷移シーケンスを固定長のベクトル埋め込みに変換すると、パディングによるノイズが信号を埋没させ、数値精度が失われます。
- 共変量の無視: 目標変数の形状が似ていても、駆動する共変量（N2, IP）が異なれば、物理的に無関係な履歴を参照してしまうリスクがあります。

2. 提案手法：RAG4CTS（Methodology）

著者らは、学習不要（Training-free）で、物理的な整合性を保つ「レジーム認識型ネイティブ RAG フレームワーク」を提案しました。

(1) 階層的時系列ネイティブ知識ベース（Hierarchical Knowledge Base）

ベクトルデータベースではなく、生データ（Raw Data）をそのまま保存する木構造の知識ベースを構築しました。
航空機タイプ（B777, A320）→ 機体番号 → 装置（PRSOV）→ レジーム（制御局面）という物理的な階層構造で管理し、パディングやスライスによる情報損失を防ぎます。

(2) 時系列ネイティブな 2 段階バイ重み付け検索メカニズム

生データ空間で直接動作し、物理的な駆動ロジックを重視した検索を行います。

バイ重み付け（Bi-weighting）:
- クリティカルポイント重み（Point Weighting）: 履歴の最近の点や、将来の制御入力（既知の共変量）に重みを付け、未知の目標変数をマスクします。
- 共変量重み（Covariate Weighting）: 相互情報量（Mutual Information）を用いて、目標変数への物理的影響力が大きい共変量（例：IP は N2 よりも MP に直接的な影響を与える）に高い重みを付けます。
2 段階フィルタリング:
1. 形状アライメント: 重み付きコサイン類似度で、トレンドや形状が類似する候補を抽出。
2. 状態精度: 重み付きマトリックスプロファイル（Matrix Profile）距離で、絶対的な数値の一致度を評価し、最終的な Top-K 候補を決定します。

(3) エージェント駆動型コンテキスト拡張（Agent-driven Context Augmentation）

検索された履歴を単純に連結するのではなく、**「エージェント（Top-1 の最も類似したサンプル）」**を用いて自己教師あり学習を行います。
エージェントの「既知の未来値」を正解として、どの程度の数の履歴（Top-K）をコンテキストに含めるのが最適か（ $k^*$ ）を貪欲探索で動的に決定します。これにより、過剰なノイズを防ぎつつ、必要な文脈を最適化します。

3. 主要な貢献（Key Contributions）

時系列ネイティブ知識ベースの構築: ベクトル化を行わず、生データの物理的整合性を維持した階層的ストレージの提案。
物理的整合性を保つ検索メカニズム: 共変量の因果関係と時系列の重要な点を考慮したバイ重み付け検索の設計。
動的コンテキスト最適化: 固定されたコンテキスト長ではなく、エージェントによる自己評価で最適な履歴数を決定する戦略。
実世界での完全デプロイ: 中国南方航空の Apache IoTDB 環境に実装され、予知保全システムとして運用されています。

4. 実験結果（Results）

中国南方航空の CSA-PRSOV データセット（B777, A320 の左右エンジン）を用いた評価結果は以下の通りです。

予測精度: 既存の深層学習モデル（DLinear, TimeMixer など）、時系列基盤モデル（Chronos-2, TimesFM）、および既存の RAG 手法（TS-RAG）をすべて上回りました。
- 例：B777L における MSE は、次点の Pyraformer (0.085) や Chronos-2 (0.296) に対し、RAG4CTS は 0.058 と大幅に低誤差を達成しました。
共変量の重要性: 共変量（IP, N2）を完全に利用した場合、予測精度が最も高くなりました。
アブレーション研究:
- 検索指標の組み合わせ（Cosine + Matrix Profile）が最も効果的でした。
- 動的なコンテキスト長さ（ $k^*$ ）の選択が、固定長よりも優れていることが示されました。
実運用成果:
- 2025 年 11 月のデプロイ以降、2 ヶ月間で1 件の PRSOV 故障をゼロの誤報（False Alarm）で特定しました。
- 故障の兆候（MSE の急激な変動）を早期に検知し、航空機が地上に留まる（AOG）事態や技術的遅延を防ぎました。

5. 意義と結論（Significance）

この研究は、以下の点で産業用時系列予測の新たなパラダイムを示しています。

データ不足への解決: 大量の学習データを必要とせず、過去の生データ（知識ベース）を直接参照することで、希少な故障モードや短い遷移シーケンスに対処可能にしました。
物理的整合性の確保: 単なる統計的な類似性ではなく、物理的な駆動要因（共変量）に基づいた検索を行うことで、産業システム特有の「物理法則」を尊重した予測を実現しました。
実用性の証明: 学術的な枠組みを Apache IoTDB 上で実装し、航空会社の予知保全システムとして実際に稼働させ、経済的損失の回避と安全性向上に貢献しました。

結論として、RAG4CTS は、データが希少で物理的制約が厳しい産業環境において、従来の TSFM や RAG 手法の限界を克服し、信頼性の高い予知保全を可能にする強力でスケーラブルなソリューションです。