Each language version is independently generated for its own context, not a direct translation.
1. 문제 정의 (Problem Statement)
비구조화된 환경에서 작동하는 로봇 시스템은 간헐적인 접촉 (intermittent contacts), 마찰 변동성, 모델링되지 않은 유연성 (unmodeled compliance) 등으로 인해 큰 불확실성에 직면합니다. 이러한 문제를 해결하기 위한 기존 접근법들은 다음과 같은 한계를 가집니다.
- 해석적 강체 모델 (Analytical Rigid-body Models): 물리 법칙에 기반하여 강건한 구조를 제공하지만, 복잡한 상호작용 효과 (마찰, 충격 등) 를 포착하지 못해 정확도가 떨어집니다.
- 순수 데이터 기반 모델 (Purely Data-driven Models): 표현력이 뛰어나지만 물리적 일관성 (physical consistency) 을 위반할 수 있으며, 데이터 편향과 장기 예측 시 발생하는 누적 오차 (drift) 문제가 있습니다.
- 확정적 잔차 모델 (Deterministic Residuals): 기존 물리 informed 모델들은 비보존적 힘 (마찰, 접촉) 을 결정론적으로 모델링하는 경우가 많습니다. 이는 접촉 전이와 같은 다중 모드 (multi-modal) 현상을 평균화하여 물리적으로 실현 불가능한 결과를 초래할 수 있습니다.
따라서, 물리적 구조를 유지하면서도 복잡한 확률적 상호작용을 효과적으로 모델링할 수 있는 새로운 동역학 학습 프레임워크가 필요합니다.
2. 제안 방법론: STRIDE (Methodology)
저자들은 STRIDE를 제안하며, 로봇 동역학을 구조화된 보존적 (conservative) 강체 역학과 확률적 비보존적 (stochastic non-conservative) 상호작용 효과로 명시적으로 분리합니다.
A. 동역학 분해 (Dynamics Decomposition)
로봇의 가속도 q¨는 다음과 같이 두 가지 구성 요소로 분해됩니다:
q¨pred=fLNN(q,q˙,τ)+M−1(q)ϵCFM(q,q˙,τ,z)
구조적 구성 요소 (Structured Component):
- **라그랑지안 신경망 (Lagrangian Neural Network, LNN)**을 사용하여 모델링합니다.
- 운동 에너지와 위치 에너지를 학습하여 오일러 - 라그랑주 방정식을 따르도록 강제합니다.
- 질량 행렬 M(q)는 Cholesky 분해를 통해 양정치 (positive-definite) 성질을 보장하여 물리적 일관성을 유지합니다.
- 이 부분은 관성 결합 및 운동량 일관성과 같은 기본 물리 법칙을 담당합니다.
잔차 구성 요소 (Residual Component):
- **조건부 흐름 매칭 (Conditional Flow Matching, CFM)**을 사용하여 모델링합니다.
- 마찰, 충격, 미모델링된 힘 등 비보존적 효과를 확률적 생성 과정으로 표현합니다.
- 접촉 전이 시 발생하는 다중 모드 (multi-modal) 분포를 효과적으로 포착하며, 결정론적 평균화 편향을 방지합니다.
- 확산 모델 (Diffusion) 과 달리 연속 시간 흐름을 학습하여 단일 단계 (또는 적은 단계) 로 효율적인 샘플링이 가능합니다.
B. 학습 전략 (Joint Training)
두 구성 요소는 독립적으로 학습되지 않고, 관찰된 가속도 데이터에 대한 단일 지도 학습 목적 함수 하에 **엔드 - 투 - 엔드 (end-to-end)**로 공동 학습됩니다.
- LNN 은 낮은 분산의 구조화된 동역학을 학습하고, CFM 잔차는 확률적 변동을 담당하도록 암묵적인 역할 분담이 이루어집니다.
3. 주요 기여 (Key Contributions)
- 하이브리드 동역학 모델링: 물리 법칙 기반의 라그랑지안 사전 지식 (Prior) 과 확률적 생성 모델 (CFM) 을 결합하여, 물리적 일관성과 복잡한 상호작용의 표현력을 동시에 확보했습니다.
- 확률적 잔차의 도입: 접촉 및 마찰과 같은 비보존적 힘을 결정론적 함수가 아닌 확률 분포로 모델링하여, 다중 모드 행동을 정확히 포착하고 평균화 편향을 제거했습니다.
- 효율적인 추론: 확산 모델 (Diffusion) 대비 계산 비용이 낮은 흐름 매칭 (Flow Matching) 을 사용하여, 실시간 제어 루프 (high-frequency control loops) 에 적용 가능한 추론 속도를 달성했습니다.
- 광범위한 검증: 단순 진자 시스템부터 4 족 보행 로봇 (Unitree Go1), 휴머노이드 (Unitree G1) 에 이르기까지 다양한 복잡도의 시스템에서 유효성을 입증했습니다.
4. 실험 결과 (Results)
STRIDE 는 Unitree Go1(4 족) 과 G1(휴머노이드) 에 대한 시뮬레이션 및 실제 하드웨어 실험을 통해 평가되었습니다.
- 장기 예측 정확도 및 안정성:
- 30 스텝 이상의 장기 롤아웃 (rollout) 시, STRIDE 는 결정론적 잔차 기반 모델 (DeLaN) 대비 약 20% 이상의 예측 오차 감소를 보였습니다.
- 무구조화 모델 (Plain MLP) 대비 Go1 에서 83%, G1 에서 **53%**의 오차 감소 효과를 거두었습니다.
- 접촉 힘 예측:
- 지면 반력 (Ground Reaction Force) 예측 오차가 DeLaN 대비 약 30% 감소했습니다.
- 충격 및 스텝 - 스윙 전이 시 발생하는 급격한 불연속성을 결정론적 모델보다 정확하게 포착하여 힘의 평활화 (smoothing) 현상을 줄였습니다.
- 추론 효율성:
- 확산 모델 기반 잔차와 비교하여, 동일한 정확도를 달성하는 데 필요한 함수 평가 횟수 (NFEs) 가 훨씬 적으며, 더 높은 샘플링 주파수를 유지하여 실시간 제어에 적합함을 입증했습니다.
- 하드웨어 배포 (실제 로봇):
- Unitree Go1 에서 MPPI(Model Predictive Path Integral) 제어기에 통합되어 50Hz 로 실시간 구동되었습니다.
- 미끄러운 표면, 20 도 경사, 진흙, 잔디 등 보지 못한 4 가지 지형에 대한 제로샷 (zero-shot) 적응이 성공적으로 이루어졌으며, 다양한 보행 (trot, pronk 등) 간 매끄러운 전환이 가능했습니다.
- 위험한 동역학 영역:
- 1 자유도 진자 실험에서 불안정 평형점 근처의 위상 공간 구조 (phase portrait) 를 보존하며, 결정론적 모델이 보이는 평균화 편향을 방지함을 확인했습니다.
5. 의의 및 결론 (Significance & Conclusion)
STRIDE 는 로봇 제어 분야에서 물리 기반 모델의 강건성과 데이터 기반 모델의 표현력을 성공적으로 융합한 사례입니다.
- 실용적 가치: 복잡한 비구조화 환경에서도 안정적인 모델 기반 제어 (Model-based Control) 를 가능하게 하여, MPC 및 궤적 최적화 알고리즘의 신뢰성을 높입니다.
- 확장성: 고차원 휴머노이드 로봇에서도 성능이 입증되어, 향후 더 복잡한 로봇 플랫폼에 적용 가능한 확장성을 보입니다.
- 미래 방향: 불확실성 인식 계획 (uncertainty-aware planning) 과의 통합, 그리고 시각 관측을 포함한 환경 의존적 상호작용 모델링으로의 확장을 제안합니다.
결론적으로, STRIDE 는 불확실성이 높은 환경에서 로봇이 장기적으로 안정적으로 작동하고, 접촉 및 마찰과 같은 복잡한 물리적 현상을 정밀하게 예측할 수 있도록 하는 획기적인 동역학 학습 프레임워크입니다.