From the Linear Quadratic Regulator (LQR) to the (Deterministic) Kalman Filter in Two Easy Steps

이 논문은 상태 추정 문제를 동차 좌표를 사용하여 순수 이차 LQR 정식화로 먼저 변환한 다음, 결과적인 해를 분할하여 전통적인 칼만 필터의 역학 및 리카티 방정식을 회복하는 과정을 통해, 선형 이차 조절기(LQR)로부터 결정론적 칼만 필터를 유도하는 방법을 보여주는 2단계 튜토리얼을 제시한다.

원저자: Bassam Bamieh

게시일 2026-06-11✓ Author reviewed
📖 4 분 읽기☕ 가벼운 읽기

원저자: Bassam Bamieh

원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

당신은 울창한 숲속에서 길을 잃은 등산객의 정확한 위치를 파악하려고 노력 중이라고 상상해 보십시오. 당신에게는 두 가지 정보원이 있지만, 둘 다 결함이 있습니다.

  1. 당신의 지도 (모델): 등산객의 일반적인 경로와 속도는 알고 있지만, 지형이 까다로워 등산객이 발을 헛디디거나 경로를 이탈할 수도 있습니다.
  2. 당신의 쌍안경 (측정값): 가끔 등산객을 볼 수는 있지만, 나무들이 시야를 가리고 있고 상이 흐릿합니다.

칼만 필터(Kalman Filter)는 이 두 가지 불완전한 정보원을 결합하여 등산객의 실제 위치를 추측하는 수학적 도구입니다. 보통 이 개념은 "노이즈"나 "확률"과 같은 복잡한 통계적 문제로 가르쳐집니다.

Bassam Bamieh의 이 논문은 이를 바라보는 더 단순하고 다른 방법을 제시합니다. 그는 이 문제를 확률적으로 생각할 필요가 없다고 주장합니다. 대신, 이것을 하나의 **결정론적인 퍼즐(deterministic puzzle)**로 취급합니다: "우리가 본 것을 설명하는 가장 단순한 이야기는 무엇인가?"

이 논문은 일상적인 비유를 사용하여 이 퍼즐을 해결하는 "두 가지 쉬운 단계"를 설명합니다.

핵심 아이디어: 수학을 위한 "오컴의 면도날"

논문은 **최소 불확실성 원리(Minimal Uncertainty Principle)**라는 원칙으로 시작합니다. 당신이 범죄 현장을 재구성하려는 탐정이라고 상상해 보십시오. 범죄가 일어날 수 있는 방법은 무수히 많습니다.

  • 이야기 A: 용의자가 5마일을 달렸고, 10번 넘어졌으며, 목격자는 환각을 보고 있었다.
  • 이야기 B: 용의자가 1마일을 걸었고, 한 번 비틀거렸으며, 목격자는 시력이 약간 흐릿했다.

논문은 말합니다: 이야기 B를 선택하십시오. 왜냐하면요? 이야기 B가 사실에 부합하기 위해 요구하는 *"이상함"(불확실성)의 양이 가장 적기 때문입니다. 수학적으로 말하자면, 우리는 "오차"(비틀거림과 흐릿한 시야)가 가능한 한 작은 이야기를 찾고자 하는 것입니다.

1단계: "동차 좌표(Homogeneous Coordinates)" 기법

첫 번째 난관은 이 "가장 단순한 이야기" 문제를 푸는 수학이 매우 복잡하다는 점입니다. 여기에는 제곱 항(예: "거리의 제곱")과 직선 항(예: "거리")이 섞여 있습니다. 이는 마치 레시피에는 "밀가루 2컵"과 "소금 한 꼬집"이 적혀 있는데, 정작 섞는 그릇은 오직 특정 "제곱" 형식의 재료만 받아들일 수 있는 케이크를 굽는 것과 같습니다.

해결책: 논문은 **동차 좌표(Homogeneous Coordinates)**라고 불리는 마법 같은 기술을 제안합니다.

  • 비유: 당신이 종이 위에 2D 그림을 그리고 있다고 상상해 보십시오. 수학적 계산이 잘 작동하도록, 그림 옆에 "1"이라는 숫자를 붙여 3차원을 추가합니다. 갑자기 당신의 2D 문제는 모든 것이 깔끔하고 대칭적인 상자 안에 딱 들어맞는 3D 문제로 변합니다.
  • 역할: 이 시스템에 이 "추가된 1"을 더함으로써, 뒤섞인 복잡한 수학 문제는 완벽하게 깨끗하고 순수한 "제곱" 형태의 수학 문제로 변환됩니다.
  • 결과: 이 깨끗해진 문제는 **선형 이차 조절기(Linear Quadratic Regulator, LQR)**와 정확히 일치합니다. 만약 당신이 LQR 문제(자동차를 가장 연료 효율적으로 운전하는 방법을 찾는 것과 같은 문제)를 풀 줄 안다면, 이제 이 복잡한 추정 문제를 풀 수 있게 됩니다.

이것이 중요한 이유: 논문은 여기서 흥들이로운 통찰을 지적합니다. 제어 문제(자동차 운전 등)에서 이 "추가된" 수학은 보통 미리 계획된 피드포워드 신호를 나타냅니다. 추정 문제(등산객 추적 등)에서는 그 동일한 "추가된" 수학이 관측자(observer), 즉 시간이 흐름에 따라 학습하고 추측을 업데이트하는 부분을 나타냅니다.

2단계: "시간 역전"과 "최종 추측"

이제 깨끗한 제곱 문제를 갖게 되었으니, 이를 풀어야 합니다. 하지만 함정이 있습니다. 표준적인 운전 문제에서는 출발 지점을 알고 있습니다. 하지만 이 추정 문제에서는 등산객이 어디서 시작했는지 모릅니다. 우리는 단지 과거의 데이터를 바탕으로 그들이 지금 어디에 있는지 알아내려 할 뿐입니다.

해결책: 논문은 영리한 두 단계의 기법을 사용합니다.

  1. 끝을 가정하라: 잠시 동안 당신이 마지막 순간에 등산객이 어디에 도착했는지 알고 있다고 가정합니다. 시작과 끝을 안다면, 그 사이의 "가장 단순한 경로"를 계산하는 것은 쉽습니다.
  2. 시간 역전: "A에서 시작하여 B로 가는 것"에 대한 수학은 "B에서 시작하여 A로 가는 것"의 거울 이미지입니다. 논문은 문제를 시간적으로 뒤집습니다. "시작부터 끝까지 어떻게 가는가?"라고 묻는 대신, "우리가 도착 지점에 있다면, 어떻게 여기까지 왔는가?"라고 묻습니다.
  3. 추측 최적화: 우리는 실제로 최종 위치를 모르기 때문에, 2단계의 답을 가져와 다음과 같이 질문합니다. "어떤 최종 위치가 전체적인 '이상함'(불확실성)을 가장 작게 만드는가?"

결과: 이 최적화를 수행하면, 복잡했던 방정식들이 마법처럼 유명한 칼만 필터 방정식으로 단순화됩니다.

  • "관측기 이득(Observer Gain)"(지도를 얼마나 믿을지, 아니면 쌍안경을 얼마나 믿을지)이 자연스럽게 도출됩니다.
  • "리카티 방정식(Riccati Equation)"(필터를 업데이트하는 복잡한 수학)이 이 "도착 비용(cost-to-arrive)" 문제의 해답으로서 나타납니다.

큰 그림: 확실성 vs 정보

논문은 이 수학에 대한 매혹적인 재해석으로 결론을 맺습니다.

  • 전통적인 (확률적) 관점에서, 필터는 당신이 얼마나 불확실한지를 알려주는 "공분산 행렬(Covariance Matrix)"을 계산합니다. 큰 숫자는 "나는 전혀 모르겠다"는 뜻입니다.
  • 이 논문의 관점에서, 수학은 "정보 행렬(Information Matrix)"(또는 확신 행렬)을 계산합니다.
    • 비유: 그릇을 생각해 보십시오. 그릇이 매우 가파르고 깊으면, 그 안에 놓인 구슬은 바닥을 향해 빠르게 굴러 내려갑니다. 이는 당신이 바닥의 위치에 대해 매우 확실함을 의미합니다. 만약 그릇이 평평하다면, 구슬은 어디로든 굴러갈 수 있으며, 당신은 불확실함을 의미합니다.
    • 논문은 식에 등장하는 행렬 SS가 이 그릇의 경사도를 측정한다고 주장합니다. 큰 SS 값은 "그릇"이 가파르다는 것을 의미하며, 이는 필터가 자신의 추정치에 대해 매우 확신하고 있음을 뜻합니다.

요약

이 논문은 새로운 필터를 발명하는 것이 아니라, 레시피를 다시 쓰는 것입니다.

  1. "무작위 노이즈에 대해 생각하지 마십시오. 대신 데이터에 대한 가장 단순하고 오류가 적은 설명을 찾는 것에 집중하십시오."라고 말합니다.
  2. **동차 좌표(homogeneous coordinates)**라는 수학적 기법을 사용하여, 복잡한 문제를 깨끗한 표준 제어 문제로 변환합니다.
  3. 시간 역전을 사용하여 이 문제를 해결하며, 칼만 필터가 결정론적인 세상에서 불확실성을 최소화하는 최적의 방법임을 보여줍니다.

이것은 칼만 필터가 근본적으로 효율성과 단순함, 즉 가장 적은 가정을 필요로 하는 경로를 선택하는 것에 관한 것임을 보여주기 위해 무서운 확률 이론을 걷어낸 "튜토리얼"입니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →