From the Linear Quadratic Regulator (LQR) to the (Deterministic) Kalman… — 쉬운 설명

당신은 울창한 숲속에서 길을 잃은 등산객의 정확한 위치를 파악하려고 노력 중이라고 상상해 보십시오. 당신에게는 두 가지 정보원이 있지만, 둘 다 결함이 있습니다.

당신의 지도 (모델): 등산객의 일반적인 경로와 속도는 알고 있지만, 지형이 까다로워 등산객이 발을 헛디디거나 경로를 이탈할 수도 있습니다.
당신의 쌍안경 (측정값): 가끔 등산객을 볼 수는 있지만, 나무들이 시야를 가리고 있고 상이 흐릿합니다.

칼만 필터(Kalman Filter)는 이 두 가지 불완전한 정보원을 결합하여 등산객의 실제 위치를 추측하는 수학적 도구입니다. 보통 이 개념은 "노이즈"나 "확률"과 같은 복잡한 통계적 문제로 가르쳐집니다.

Bassam Bamieh의 이 논문은 이를 바라보는 더 단순하고 다른 방법을 제시합니다. 그는 이 문제를 확률적으로 생각할 필요가 없다고 주장합니다. 대신, 이것을 하나의 **결정론적인 퍼즐(deterministic puzzle)**로 취급합니다: "우리가 본 것을 설명하는 가장 단순한 이야기는 무엇인가?"

이 논문은 일상적인 비유를 사용하여 이 퍼즐을 해결하는 "두 가지 쉬운 단계"를 설명합니다.

핵심 아이디어: 수학을 위한 "오컴의 면도날"

논문은 **최소 불확실성 원리(Minimal Uncertainty Principle)**라는 원칙으로 시작합니다. 당신이 범죄 현장을 재구성하려는 탐정이라고 상상해 보십시오. 범죄가 일어날 수 있는 방법은 무수히 많습니다.

이야기 A: 용의자가 5마일을 달렸고, 10번 넘어졌으며, 목격자는 환각을 보고 있었다.
이야기 B: 용의자가 1마일을 걸었고, 한 번 비틀거렸으며, 목격자는 시력이 약간 흐릿했다.

논문은 말합니다: 이야기 B를 선택하십시오. 왜냐하면요? 이야기 B가 사실에 부합하기 위해 요구하는 *"이상함"(불확실성)의 양이 가장 적기 때문입니다. 수학적으로 말하자면, 우리는 "오차"(비틀거림과 흐릿한 시야)가 가능한 한 작은 이야기를 찾고자 하는 것입니다.

1단계: "동차 좌표(Homogeneous Coordinates)" 기법

첫 번째 난관은 이 "가장 단순한 이야기" 문제를 푸는 수학이 매우 복잡하다는 점입니다. 여기에는 제곱 항(예: "거리의 제곱")과 직선 항(예: "거리")이 섞여 있습니다. 이는 마치 레시피에는 "밀가루 2컵"과 "소금 한 꼬집"이 적혀 있는데, 정작 섞는 그릇은 오직 특정 "제곱" 형식의 재료만 받아들일 수 있는 케이크를 굽는 것과 같습니다.

해결책: 논문은 **동차 좌표(Homogeneous Coordinates)**라고 불리는 마법 같은 기술을 제안합니다.

비유: 당신이 종이 위에 2D 그림을 그리고 있다고 상상해 보십시오. 수학적 계산이 잘 작동하도록, 그림 옆에 "1"이라는 숫자를 붙여 3차원을 추가합니다. 갑자기 당신의 2D 문제는 모든 것이 깔끔하고 대칭적인 상자 안에 딱 들어맞는 3D 문제로 변합니다.
역할: 이 시스템에 이 "추가된 1"을 더함으로써, 뒤섞인 복잡한 수학 문제는 완벽하게 깨끗하고 순수한 "제곱" 형태의 수학 문제로 변환됩니다.
결과: 이 깨끗해진 문제는 **선형 이차 조절기(Linear Quadratic Regulator, LQR)**와 정확히 일치합니다. 만약 당신이 LQR 문제(자동차를 가장 연료 효율적으로 운전하는 방법을 찾는 것과 같은 문제)를 풀 줄 안다면, 이제 이 복잡한 추정 문제를 풀 수 있게 됩니다.

이것이 중요한 이유: 논문은 여기서 흥들이로운 통찰을 지적합니다. 제어 문제(자동차 운전 등)에서 이 "추가된" 수학은 보통 미리 계획된 피드포워드 신호를 나타냅니다. 추정 문제(등산객 추적 등)에서는 그 동일한 "추가된" 수학이 관측자(observer), 즉 시간이 흐름에 따라 학습하고 추측을 업데이트하는 부분을 나타냅니다.

2단계: "시간 역전"과 "최종 추측"

이제 깨끗한 제곱 문제를 갖게 되었으니, 이를 풀어야 합니다. 하지만 함정이 있습니다. 표준적인 운전 문제에서는 출발 지점을 알고 있습니다. 하지만 이 추정 문제에서는 등산객이 어디서 시작했는지 모릅니다. 우리는 단지 과거의 데이터를 바탕으로 그들이 지금 어디에 있는지 알아내려 할 뿐입니다.

해결책: 논문은 영리한 두 단계의 기법을 사용합니다.

끝을 가정하라: 잠시 동안 당신이 마지막 순간에 등산객이 어디에 도착했는지 알고 있다고 가정합니다. 시작과 끝을 안다면, 그 사이의 "가장 단순한 경로"를 계산하는 것은 쉽습니다.
시간 역전: "A에서 시작하여 B로 가는 것"에 대한 수학은 "B에서 시작하여 A로 가는 것"의 거울 이미지입니다. 논문은 문제를 시간적으로 뒤집습니다. "시작부터 끝까지 어떻게 가는가?"라고 묻는 대신, "우리가 도착 지점에 있다면, 어떻게 여기까지 왔는가?"라고 묻습니다.
추측 최적화: 우리는 실제로 최종 위치를 모르기 때문에, 2단계의 답을 가져와 다음과 같이 질문합니다. "어떤 최종 위치가 전체적인 '이상함'(불확실성)을 가장 작게 만드는가?"

결과: 이 최적화를 수행하면, 복잡했던 방정식들이 마법처럼 유명한 칼만 필터 방정식으로 단순화됩니다.

"관측기 이득(Observer Gain)"(지도를 얼마나 믿을지, 아니면 쌍안경을 얼마나 믿을지)이 자연스럽게 도출됩니다.
"리카티 방정식(Riccati Equation)"(필터를 업데이트하는 복잡한 수학)이 이 "도착 비용(cost-to-arrive)" 문제의 해답으로서 나타납니다.

큰 그림: 확실성 vs 정보

논문은 이 수학에 대한 매혹적인 재해석으로 결론을 맺습니다.

전통적인 (확률적) 관점에서, 필터는 당신이 얼마나 불확실한지를 알려주는 "공분산 행렬(Covariance Matrix)"을 계산합니다. 큰 숫자는 "나는 전혀 모르겠다"는 뜻입니다.
이 논문의 관점에서, 수학은 "정보 행렬(Information Matrix)"(또는 확신 행렬)을 계산합니다.
- 비유: 그릇을 생각해 보십시오. 그릇이 매우 가파르고 깊으면, 그 안에 놓인 구슬은 바닥을 향해 빠르게 굴러 내려갑니다. 이는 당신이 바닥의 위치에 대해 매우 확실함을 의미합니다. 만약 그릇이 평평하다면, 구슬은 어디로든 굴러갈 수 있으며, 당신은 불확실함을 의미합니다.
- 논문은 식에 등장하는 행렬 $S$ 가 이 그릇의 경사도를 측정한다고 주장합니다. 큰 $S$ 값은 "그릇"이 가파르다는 것을 의미하며, 이는 필터가 자신의 추정치에 대해 매우 확신하고 있음을 뜻합니다.

요약

이 논문은 새로운 필터를 발명하는 것이 아니라, 레시피를 다시 쓰는 것입니다.

"무작위 노이즈에 대해 생각하지 마십시오. 대신 데이터에 대한 가장 단순하고 오류가 적은 설명을 찾는 것에 집중하십시오."라고 말합니다.
**동차 좌표(homogeneous coordinates)**라는 수학적 기법을 사용하여, 복잡한 문제를 깨끗한 표준 제어 문제로 변환합니다.
시간 역전을 사용하여 이 문제를 해결하며, 칼만 필터가 결정론적인 세상에서 불확실성을 최소화하는 최적의 방법임을 보여줍니다.

이것은 칼만 필터가 근본적으로 효율성과 단순함, 즉 가장 적은 가정을 필요로 하는 경로를 선택하는 것에 관한 것임을 보여주기 위해 무서운 확률 이론을 걷어낸 "튜토리얼"입니다.

기술 요약: LQR에서 결정론적 칼만 필터까지

문제 정식화
본 논문은 선형 시변 시스템에 대한 결정론적 상태 추정 문제를 다룬다. 시스템은 $\dot{x}(t) = Ax(t) + w(t)$ 및 $y(t) = Cx(t) + v(t) $방정식으로 모델링된다. 여기서 출력$ y(t) $는 알려져 있지만, 프로세스 외란$ w(t) $, 측정 노이즈$ v(t) $, 그리고 초기 상태$ x_i $는 알 수 없다. 목표는 시스템 역학을 따르면서 불확실성 삼중항$ (w, v, x_i) $의 "크기"를 최소화하는 이차 비용 함수를 최소화하는 상태 궤적$ \hat{x}(t) $를 찾는 것이다. 이 비용 범함수$ J $는 알려진 측정 신호$ y(t) $가 이차항$ (y - C\hat{x})^*V(y - C\hat{x})$ 내에 존재하기 때문에 상태와 입력에 대해 아핀-이차(affine-quadratic) 형태를 띤다. 본 논문은 이를 확률적 추정 문제가 아닌 "입력 설계(input design)" 문제로 프레임화하며, "최소 불확실성 원리(Minimal Uncertainty Principle)"를 따른다. 이는 오컴의 면도날과 유사하게, 가장 적은 가정(가장 작은 불확실성 노름)을 필요로 하는 궤적을 선택하는 것이다.

방법론: "두 가지 쉬운 단계"
저자는 아핀-이차 최적화 문제를 표준 선형 이차 조절기(LQR) 프레임워크로 변환하는 두 단계의 변환 과정을 통해 칼만 필터 방정식을 유도한다.

동차 좌표를 통한 동차화(Homogenization via Homogeneous Coordinates):
첫 번째 단계는 아핀-이차 비용(이차, 선형, 상수 항을 포함하는)을 순수하게 이차적인 비용으로 변환한다. 이는 "동차 좌표"를 사용하여 시스템을 더 높은 차원의 상태 공간으로 임베딩함으로써 달성된다. 보조 스칼라 상태 $\alpha$ 가 상태 벡터 $x$ 에 추가되며, $\alpha(t) \equiv 1$ 이라는 제약 조건이 붙는다. 이는 원래의 시스템과 비용을 상태 $\xi = [x^T, 1]^T$ 를 갖는 더 큰 시스템과 순수 이차 목적 함수로 변환한다. 이러한 임베딩은 아핀-이차 문제를 위한 제어기가 (메모리리스 방식의 순수 이차 제어기와 달리) 역학적 성분을 본질적으로 포함하고 있음을 드러내는데, 이는 추적에서의 피드포워드 역학이나 추정에서의 옵저버 역학에 해당한다.
시간 역전 및 최종 상태 최적화:
두 번째 단계는 "최종 조건이 있는 LQR(LQR with final conditions)" 정식화를 활용한다. 초기 상태를 지정하고 "비용-투-고(cost-to-go)"를 최소화하는 표준 LQR과 달리, 이 쌍대 문제는 최종 상태를 지정하고 "비용-투-어라이브(cost-to-arrive)"를 최소화한다.

추정 문제는 최종 상태 $\hat{x}(t)$ 가 알려져 있다(고정되어 있다)고 가정하여 먼저 해결된다. 이는 전방향으로 실행되는 행렬 미분 리카티 방정식(DRE) $S(t)$ 와 보조 벡터 $s_1(t)$ 에 의해 특징지어지는 해를 산출한다.
실제로는 최종 상태를 알 수 없으므로, 최종 상태 변수에 대해 결과적인 "비용-투-어라이브" 함수를 추가로 최소화함으로써 최적의 추정치를 찾는다. 이 최적화는 $\hat{x}(t) = -S^{-1}(t)s_1(t)$ 라는 최적의 추정치를 도출한다.
이 관계를 미분하고 $S(t)$ 와 $s_1(t)$ 의 역학을 대입함으로써, 논문은 $\hat{x}(t)$ 에 대한 미분 방정식을 직접 유도한다. 이 방정식은 인과적 옵저버의 형태인 $\dot{\hat{x}} = A\hat{x} + L(y - C\hat{x})$ 를 취하며, 여기서 이득 $L$ 은 $S(t)$ 의 해로부터 유도된다.

주요 기여 및 결과

결정론적 칼만 필터의 유도: 본 논문은 시간 역전, 동차 좌표 임베딩, 최종 상태 최적화 단계를 명시적으로 분리함으로써 결정론적 칼만 필터(상태 추정기)의 간결한 유도 과정을 제공한다.
LQ-추적과의 연결: 방법론은 결정론적 추정 문제와 선형-이차(LQ) 추적(서보메커니즘) 문제 사이의 구조적 등가성을 보여준다. LQ-추적에서 보조 역학은 역방향 피드포워드 항을 제공하는 반면, 추정에서는 인과적 옵저버 역학을 제공한다.
정보 필터 정식화: 결과적인 추정기는 "정보 필터" 형태로 제시된다. 행렬 $S(t)$ 는 확률적 칼만 필터에서 발견되는 오차 공분산 행렬의 역행렬인, 전방향 DRE의 해로 식별된다.
정보의 결정론적 해석: 논문은 "정보 행렬"에 대한 결정론적 해석을 제공한다. $S(t)$ 는 확률적 공분산에 의존하기보다 "확실성 행렬(certainty matrix)"로 해석된다. 최적 추정치 주변의 "비용-투-어라이브" 함수의 곡률(이차 그릇 모양)은 $S(t)$ 에 의해 결정된다. 큰 고윳값을 가진 $S(t)$ 의 고유벡터는 높은 확실성(가파른 곡률)을 나타내는 방향에 해당하며, 작은 고윳값은 높은 불확실성에 해당한다.

의의 및 주장
본 논문은 칼만 필터의 유도를 결정론적 최적 제어 이론에 근거하여 규명함으로써 이를 명료화하는 "튜토리얼" 관점을 제공한다고 주장한다. 저자는 결정론적 또는 확률적 정식화에 대한 선호는 논리적 필연성보다는 취향의 문제라고 주장하며, Willems와 Gauss를 인용한다. 주요 의의는 다음을 포함하는 "두 가지 쉬운 단계" 접근법에 있다:

동차 좌표를 통해 아핀-이차 문제(추적 및 추정과 같은)를 표준 이차 문제(LQR)와 통합한다.
옵저버를 유도하는 데 있어 시간 역전과 "비용-투-어라이브" 함수의 역할을 명확히 한다.
확률 미적분법을 도입하지 않고, 최소 제곱 원리와 입력 설계 문제의 등가성에 의존하여 칼만 필터 방정식에 대한 엄밀한 결정론적 정당성을 제공한다.

저자는 새로운 응용이나 실험적 제안을 도입하는 것을 명시적으로 피하며, 대신 기존 개념(LQR, 동차 좌표, 쌍대성)의 이론적 통합을 통해 최적 추정기의 구조를 설명하는 데 집중한다.

From the Linear Quadratic Regulator (LQR) to the (Deterministic) Kalman Filter in Two Easy Steps

핵심 아이디어: 수학을 위한 "오컴의 면도날"

1단계: "동차 좌표(Homogeneous Coordinates)" 기법

2단계: "시간 역전"과 "최종 추측"

큰 그림: 확실성 vs 정보

요약

유사한 논문