From the Linear Quadratic Regulator (LQR) to the (Deterministic) Kalman Filter in Two Easy Steps

Este artículo presenta un tutorial de dos pasos que demuestra cómo derivar el filtro de Kalman determinista a partir del Regulador Cuadrático Lineal (LQR), convirtiendo primero el problema de estimación de estado en una formulación LQR puramente cuadrática mediante el uso de coordenadas homogéneas, y luego particionando la solución resultante para recuperar la dinámica y la ecuación de Riccati del filtro de Kalman tradicional.

Autores originales: Bassam Bamieh

Publicado 2026-06-11✓ Author reviewed
📖 6 min de lectura🧠 Análisis profundo

Autores originales: Bassam Bamieh

Artículo original bajo licencia CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Esta es una explicación generada por IA del artículo a continuación. No ha sido escrita por los autores. Para mayor precisión técnica, consulte el artículo original. Leer descargo de responsabilidad completo

Imagina que estás tratando de averiguar exactamente dónde se encuentra un excursionista perdido en un bosque denso. Tienes dos fuentes de información, pero ambas son imperfectas:

  1. Tu Mapa (El Modelo): Conoces su ruta general y su velocidad, pero el terreno es complicado y podría tropezar o tomar un desvío.
  2. Tus Binoculares (Las Mediciones): Puedes ver al excursionista ocasionalmente, pero los árboles bloquean tu visión y la imagen es borrosa.

El Filtro de Kalman es la herramienta matemática que combina estas dos fuentes imperfectas para adivinar la ubicación real del excursionista. Usualmente, esto se enseña como un problema estadístico complejo que involucra "ruido" y "probabilidad".

Este artículo de Bassam Bamieh ofrece una forma diferente y más simple de ver esto. Sostiene que no necesitas pensar en la probabilidad aleatoria, sino que puedes tratar esto como un rompecabezas determinista: "¿Cuál es la historia más simple posible que explica lo que vimos?".

Aquí están los "Dos Pasos Fáciles" para resolver este rompecabezas, explicados con analogías de la vida cotidiana.

La Idea Central: "La Navaja de Ockham" para las Matemáticas

El artículo comienza con un principio llamado Principio de Incertidumbre Mínima. Imagina que eres un detective intentando reconstruir la escena de un crimen. Hay infinitas formas en las que el crimen pudo haber ocurrido.

  • Historia A: El sospechoso corrió 5 millas, tropezó 10 veces y el testigo estaba alucinando.
  • Historia B: El sospechoso caminó 1 milla, tropezó una vez y el testigo tenía la vista ligeramente borrosa.

El artículo dice: Elige la Historia B. ¿Por qué? Porque requiere la menor cantidad de "rareza" (incertidumbre) para que los hechos encajen. En términos matemáticos, queremos la historia donde los "errores" (los tropezones y la visión borrosa) sean lo más pequeños posible.

Paso 1: El Truco de las "Coordenadas Homogéneas"

El primer obstáculo es que las matemáticas para este problema de la "historia más simple" son complicadas. Tiene una mezcla de términos al cuadrado (como "distancia al cuadrado") y términos lineales (como "distancia"). Es como intentar hornear un pastel donde la receta pide "2 tazas de harina" y "una pizca de sal", pero el tazón de mezcla solo acepta ingredientes en un formato específico de "al cuadrado".

La Solución: El artículo sugiere un truco mágico llamado Coordenadas Homogéneas.

  • La Analogía: Imagina que tienes un dibujo en 2D sobre una hoja de papel. Para que las matemáticas funcionen, añades una tercera dimensión —un "1" unido al lado de tu dibujo. De repente, tu problema en 2D se convierte en un problema en 3D donde todo encaja perfectamente en una caja simétrica y ordenada.
  • Qué hace: Al añadir este "1" extra al sistema, el problema matemático "mixto" y desordenado se transforma en un problema puramente "al cuadrado" y perfectamente limpio.
  • El Resultado: Este problema limpio es exactamente el mismo que un Regulador Cuadrático Lineal (LQR). Si sabes cómo resolver un problema LQR (que es como encontrar la forma más eficiente de conducir un coche), ahora puedes resolver este desordenado problema de estimación.

Por qué esto importa: El artículo señala un insight genial aquí. En los problemas de control (como conducir un coche), la matemática "extra" suele representar una señal de alimentación hacia adelante (feedforward) preplanificada. En los problemas de estimación (como rastrear al excursionista), esa misma matemática extra representa al observador: la parte del sistema que aprende y actualiza su suposición con el tiempo.

Paso 2: La "Inversión del Tiempo" y la "Suposición Final"

Ahora que tenemos un problema al cuadrado y limpio, necesitamos resolverlo. Pero hay un inconveniente: En un problema de conducción estándar, sabes dónde empezaste. En este problema de estimación, no sabemos dónde empezó el excursionista. Solo sabemos dónde está ahora (o mejor dicho, estamos tratando de averiguar dónde está ahora basándonos en datos pasados).

La Solución: El artículo utiliza una maniobra inteligente de dos partes:

  1. Asumir el Final: Pretende por un momento que sabes dónde terminó el excursionista en el momento final. Si conoces el inicio y el final, el "camino más simple" entre ellos es fácil de calcular.
  2. Inversión del Tiempo: La matemática de "empezar en A y terminar en B" es la imagen especular de "empezar en B y terminar en A". El artículo voltea el problema en el tiempo. En lugar de preguntar "¿Cómo llegamos del inicio al final?", pregunta "¿Si estamos en el final, cómo llegamos aquí?".
  3. Optimizar la Suposición: Dado que no conocemos realmente la posición final, tomamos la respuesta del paso 2 y preguntamos: "¿Qué posición final hace que la "rareza" total (incertidumbre) sea la más pequeña?".

El Resultado: Cuando realizas esta optimización, las ecuaciones complicadas se simplifican mágicamente en las famosas ecuaciones del Filtro de Kalman.

  • La "Ganancia del Observador" (cuánto confías en el mapa frente a los binoculares) surge de forma natural.
  • La "Ecuación de Riccati" (la matemática compleja que actualiza el filtro) aparece como la solución a este problema de "costo de llegada".

La Visión General: Certeza vs. Información

El artículo concluye con una reinterpretación fascinante de las matemáticas.

  • En la visión tradicional (estocástica), el filtro calcula una "Matriz de Covarianza", que te dice qué tan incierto estás. Un número grande significa "No tengo idea".
  • En la visión de este artículo, las matemáticas calculan una "Matriz de Información" (o Matriz de Certeza).
    • La Analogía: Piensa en un tazón. Si el tazón es muy empinado y profundo, una canica colocada dentro rodará rápidamente hacia el fondo. Esto significa que estás muy seguro de la ubicación del fondo. Si el tazón es plano, la canica puede rodar a cualquier parte; estás incierto.
    • El artículo argumenta que la matriz SS en sus ecuaciones mide la pendiente del tazón. Una SS grande significa que el "tazón" es empinado, lo que significa que el filtro tiene mucha confianza en su estimación.

Resumen

Este artículo no inventa un nuevo filtro; reescribe la receta.

  1. Dice: "Deja de pensar en el ruido aleatorio. Piensa en encontrar la explicación más simple y con menos error para tus datos".
  2. Utiliza un truco matemático (coordenadas homogéneas) para convertir un problema desordenado en un problema de control estándar y limpio.
  3. Utiliza la inversión del tiempo para resolver ese problema, revelando que el Filtro de Kalman es simplemente la forma óptima de minimizar la incertidumbre en un mundo determinista.

Es un "tutorial" que elimina la aterradora teoría de la probabilidad para mostrar que el Filtro de Kalman trata fundamentalmente de eficiencia y simplicidad: elegir el camino que requiere el menor número de suposiciones.

¿Ahogado en artículos de tu campo?

Recibe resúmenes diarios de los artículos más novedosos que coincidan con tus palabras clave de investigación — con resúmenes técnicos, en tu idioma.

Probar Digest →