From the Linear Quadratic Regulator (LQR) to the (Deterministic) Kalman… — やさしい解説

原著者： Bassam Bamieh

公開日 2026-06-11✓ Author reviewed ⓘ

📖 1 分で読めます☕ さくっと読める

原著者： Bassam Bamieh

原論文は CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) でライセンスされています。 ✨ これは以下の論文のAI生成解説です。著者が執筆したものではありません。技術的な正確性については原論文を参照してください。免責事項の全文を読む

あなたは、深い森の中で行方不明になったハイカーの正確な位置を突き止めようとしていると想像してください。あなたには2つの情報源がありますが、どちらも不完全です。

あなたの地図（モデル）: ハイカーのおおよその経路と速度は分かっていますが、地形は複雑であり、彼らがつまずいたり回り道をしたりする可能性があります。
あなたの双眼鏡（測定値）: 時折ハイカーを見ることができますが、木々が視界を遮り、映像はぼやけています。

カルマンフィルタは、これら2つの不完全な情報源を組み合わせて、ハイカーの真の位置を推測するための数学的なツールです。通常、これは「ノイズ」や「確率」を含む複雑な統計的問題として教えられます。

バッサム・バミエ（Bassam Bamieh）によるこの論文は、これに対するよりシンプルで異なる見解を提示しています。彼は、ランダムな確率について考える必要はないと主張しています。代わりに、これを決定論的なパズルとして捉えるのです。「私たちが目にしたことを説明する、最もシンプルな物語とは何か？」という問いです。

以下に、日常的な比喩を用いて説明された、このパズルを解くための論文の「2つの簡単なステップ」を記します。

核となるアイデア：「オッカムの剃刀」を数学に

この論文は、最小不確実性の原理と呼ばれる原則から始まります。あなたが探偵として犯罪現場を再構成しようとしている場面を想像してください。犯罪がどのように起きたかについては、無限のシナリオが存在します。

物語A: 容疑者は5マイル走り、10回つまずき、目撃者は幻覚を見ていた。
物語B: 容疑者は1マイル歩き、1回つまずき、目撃者は少し目がかすんでいた。

論文はこう言います：物語Bを選びなさい。 なぜなら、物語Bの方が、事実を成立させるために必要な「奇妙さ」（不確実性）が最も少ないからです。数学的な言葉で言えば、私たちは「誤差」（つまずきや視界のぼやけ）が最小となる物語を求めているのです。

ステップ1：「同次座標」のトリック

最初のハードルは、この「最もシンプルな物語」を探すための数学が非常に厄介であることです。そこには、2乗の項（「距離の2乗」など）と、直線的な項（「距離」など）が混在しています。それはまるで、「小麦粉2カップ」と「塩ひとつまみ」をレシピに求められているのに、ミキシングボウルが特定の「2乗」形式の材料しか受け付けないケーキ作りをしているようなものです。

解決策: 論文は、**同次座標（Homogeneous Coordinates）**と呼ばれる魔法のようなトリックを提案しています。

比喩: 2次元の図面が描かれた紙を想像してください。数学を機能させるために、その図面の横に「1」という第3の次元を付け加えます。すると突然、あなたの2次元の問題は、すべてが整然とした対称的な箱の中に完璧に収まる3次元の問題へと変わります。
それが何をするか: このシステムに余分な「1」を加えることで、複雑な「混合」数学の問題が、完全にクリーンで純粋な「2乗」の数学問題へと変貌します。
結果: このクリーンな問題は、**線形二次レギュレータ（LQR）**と全く同じになります。もしあなたがLQR問題（車の最も燃料効率の良い運転方法を見つけるようなもの）を解く方法を知っていれば、今やこの複雑な推定問題を解くことができるようになります。

なぜこれが重要か: 論文はここで興味深い洞察を指摘しています。制御問題（車の運転など）において、この「余分な」数学は通常、事前に計画されたフィードフォワード信号を表します。しかし、推定問題（ハイカーの追跡など）においては、その同じ「余分な」数学がオブザーバー（観測者）、つまり時間を経て推測を学習し更新していくシステムの部分を表しているのです。

ステップ2：「時間の反転」と「最終的な推測」

これでクリーンな2乗の問題が手に入りましたが、解く必要があります。しかし、落とし穴があります。標準的な運転問題では、どこからスタートするかを知っています。しかし、この推定問題では、ハイカーがどこから出発したのかを知りません。 私たちが知っているのは、過去のデータに基づいて「今、彼らがどこにいるか」を突き止めようとしているだけです。

解決策: 論文は巧妙な2段階の手順を使用します。

終わりを仮定する: 一瞬の間、あなたが最終的な瞬間にハイカーがどこに辿り着いたかを知っていると仮定します。もしスタートとゴールが分かっていれば、その間の「最もシンプルな経路」を計算するのは簡単です。
時間の反転: 「Aから始まりBに至る」ための数学は、「Bから始まりAに至る」ための数学の鏡像です。論文は問題を時間の方向に反転させます。「スタートからゴールへどう行くか？」と問う代わりに、「もしゴールにいるとしたら、どのようにしてここまで来たのか？」と問うのです。
推測を最適化する: 実際には最終的な位置を知らないため、ステップ2の答えを取り出し、「どの最終位置が、全体の『奇妙さ』（不確実性）を最小にするか？」と問いかけます。

結果: この最適化を行うと、複雑な方程式は魔法のように単純化され、有名なカルマンフィルタの方程式へと姿を変えます。

「オブザーバーゲイン」（地図をどの程度信頼するか、あるいは双眼鏡をどの程度信頼するか）が自然に導き出されます。
「リッカチ方程式」（フィルタを更新する複雑な数学）が、この「到着するためのコスト」問題の解として現れます。

全体像：確実性 vs 情報

論文は、この数学の再解釈で締めくくっています。

伝統的な（確率論的な）視点では、フィルタは「共分散行列」を計算し、それは自分がどれほど「不確実」であるかを示します。大きな数値は「全く分からない」ことを意味します。
この論文の視点では、数学は**「情報行列」（または確実性行列）**を計算しています。
- 比喩: ボウルを想像してください。ボウルが非常に急で深い場合、中に置かれたビー玉は素早く底へと転がっていきます。これは、底の位置についてあなたが非常に確信していることを意味します。もしボウルが平らであれば、ビー玉はどこへでも転がることができ、あなたは不確実になります。
- 論文は、彼らの式における行列 $S$ が「ボウルの傾斜」を測定していると主張しています。 $S$ が大きいということは、「ボウル」が急であることを意味し、フィルタがその推定に対して非常に自信を持っていることを示しています。

まとめ

この論文は新しいフィルタを発明したのではなく、レシピを書き換えたのです。

「ランダムなノイズについて考えるのをやめなさい。データの最もシンプルで、エラーの少ない説明を見つけることを考えなさい」と言っています。
**同次座標（mathematical trick）**を使用して、複雑な問題をクリーンで標準的な制御問題へと変換します。
**時間の反転（time reversal）**を用いてその問題を解き、カルマンフィルタが決定論的な世界において不確実性を最小化するための最適な方法であることを明らかにしています。

これは、恐ろしい確率論を剥ぎ取り、カルマンフィルタが根本的には効率性とシンプルさ、すなわち「最も少ない仮定で済む経路を選ぶこと」に関するものであることを示す「チュートリアル」なのです。

技術的要約：LQRから決定論的カルマンフィルタへ

問題の定式化
本論文は、線形時変システムにおける決定論的な状態推定問題を取り扱う。システムは $\dot{x}(t) = Ax(t) + w(t)$ および $y(t) = Cx(t) + v(t) $という方程式でモデル化される。ここで、出力$ y(t) $は既知であるが、プロセス外乱$ w(t) $、観測ノイズ$ v(t) $、および初期状態$ x_i $は未知である。目的は、不確実性の三つ組$ (w, v, x_i) $の「大きさ」を表す二次コスト関数を最小化するような、システム力学と整合する状態軌跡$ \hat{x}(t) $を見つけることである。このコスト汎関数$ J $は、既知の観測信号$ y(t) $が二次項$ (y - C\hat{x})^*V(y - C\hat{x})$ 内に存在するため、状態と入力に対してアフィン二次形式となる。本論文は、これを確率的な推定問題としてではなく、「入力設計」問題として構成しており、オッカムの剃刀に類似した「最小不確実性の原理」に従い、最小の仮定（最小の不確実性ノルム）を必要とする軌跡を選択している。

手法：「2つの容易なステップ」
著者は、アフィン二次最適化問題を標準的な線形二次レギュレータ（LQR）の枠組みへと変換する、2段階の変換を通じてカルマンフィルタの方程式を導出している。

同次座標による同次化：
第1のステップでは、「同次座標」を用いることで、アフィン二次コスト（二次項、一次項、および定数項を含む）を純粋な二次コストへと変換する。これは、補助的なスカラー状態 $\alpha$ を状態ベクトル $x$ に付加し、 $\alpha(t) \equiv 1$ と制約することで実現される。これにより、元のシステムとコストは、状態 $\xi = [x^T, 1]^T$ を持つより高次元のシステムと純粋な二次目的関数へと変換される。この埋め込みは、アフィン二次問題のコントローラが、メモリレスな純粋二次問題のコントローラとは異なり、本質的に動的な成分（追従におけるフィードフォワード動特性や、推定におけるオブザーバ動特性に対応するもの）を含むことを明らかにしている。
時間反転と最終状態の最適化：
第2のステップでは、「最終条件付きLQR」の定式化を利用する。初期状態を指定して「到達までのコスト（cost-to-go）」を最小化する標準的なLQRとは異なり、この双対問題は最終状態を指定し、「到着までのコスト（cost-to-arrive）」を最小化する。

推定問題は、まず最終状態 $\hat{x}(t)$ が既知（固定）であると仮定して解かれる。これにより、前方方向に実行される行列微分リッカチ方程式（DRE） $S(t)$ と補助ベクトル $s_1(t)$ によって特徴付けられる解が得られる。
最終状態は実際には未知であるため、最適な推定値は、結果として得られる「到着までのコスト」関数を最終状態変数に関してさらに最小化することによって求められる。この最適化により、最適な状態推定値 $\hat{示す$ \hat{x}(t) = -S^{-1}(t)s_1(t)$ が得られる。
この関係式を微分し、 $S(t)$ と $s_1(t)$ の動特性を代入することで、論文は $\hat{x}(t)$ の直接的な微分方程式を導出する。この方程式は、 $\dot{\hat{x}} = A\hat{x} + L(y - C\hat{x})$ という形式の因果的なオブザーバとなる。ここでゲイン $L$ は、解 $S(t)$ から導かれる。

主な貢献と結果

決定論的カルマンフィルタの導出： 本論文は、時間反転、同次座標の埋め込み、および最終状態の最適化というステップを明示的に分離することにより、決定論的カルマンフィルタ（状態推定器）の簡潔な導出を提供している。
LQ追従との接続： この手法は、決定論的な推定問題と線形二次（LQ）追従（サーボメカニズム）問題との間の構造的な等価性を実証している。LQ追従において補助的な動特性は非因果的なフィードフォワード項を提供するが、推定においては因果的なオブザーバ動特性を提供する。
情報フィルタ定式化： 得られる推定器は「情報フィルタ」の形式で提示される。行列 $S(t)$ は、確率的なカルマンフィルタで見られる誤差共分散行列の逆行列である、前方時間のDREの解として特定される。
情報の決定論的解釈： 本論文は、「情報行列」の決定論的な解釈を提示している。 $S(t)$ は確率的な共分散ではなく、「確信行列（certainty matrix）」として解釈される。「到着までのコスト」関数の最適な推定値の周囲の曲率（二次的なボウル状の形状）は、 $S(t)$ によって決定される。 $S(t)$ の大きな固有値を持つ固有ベクトルは高い確信度（急峻な曲率）の方向に対応し、小さな固有値は高い不確実性の方向に対応する。

意義と主張
本論文は、カルマンフィルタの導出を決定論的な最適制御理論に根ざすことで解明するという「チュートリアル」的な視点を提供すると主張している。著者は、決定論的定式化と確率的定式化のどちらを好むかは、論理的な必然性ではなく好みの問題であるとし、WillemsやGaussを引用している。主な意義は、「2つの容易なステップ」によるアプローチにあり、それは以下の通りである：

同次座標を用いて、アフィン二次問題（追従や推定など）を標準的な二次問題（LQR）と統一的に扱う。
時間反転と「到着までのコスト」関数の役割を明確にし、最適なオブザーバを導出する。
確率解析を用いず、最小二乗原理と入力設計問題の等価性に依拠することで、カルマンフィルタの方程式に対する厳密な決定論的正当性を与える。

著者は、新しい応用や実験的な提案を導入することを明示的に避け、既存の概念（LQR、同次座標、および双対性）の理論的統一を通じて、最適な推定器の構造を説明することに集中している。

From the Linear Quadratic Regulator (LQR) to the (Deterministic) Kalman Filter in Two Easy Steps

核となるアイデア：「オッカムの剃刀」を数学に

ステップ1：「同次座標」のトリック

ステップ2：「時間の反転」と「最終的な推測」

全体像：確実性 vs 情報

まとめ

技術的要約：LQRから決定論的カルマンフィルタへ

関連論文