Embodiment-Aware Generalist Specialist Distillation for Unified Humanoid Whole-Body Control

이 논문은 다양한 휴머노이드 로봇의 동역학과 구조적 차이를 극복하고 단일 정책으로 보행, 쪼그려 앉기, 기댐 등 다양한 행동을 제어할 수 있도록 하는 'EAGLE'이라는 일반화-전문가 지식 증류 프레임워크를 제안합니다.

Quanquan Peng, Yunfeng Lin, Yufei Xue, Jiangmiao Pang, Weinan Zhang

게시일 2026-03-02
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"서로 다른 몸매를 가진 다양한 휴머노이드 로봇을 한 명의 '유니콘' 같은 마스터 로봇이 모두 잘 조종할 수 있게 만드는 방법"**을 소개합니다.

기존에는 로봇 하나하나마다 따로 훈련을 시켜야 했지만, 이 연구는 **"한 번에 배운 지식을 서로 공유하고 다듬는 과정"**을 통해 모든 로봇을 한 번에 제어하는 기술을 개발했습니다.

이 복잡한 기술을 쉽게 이해할 수 있도록 **'요리 학교'**와 '전문가 팀' 비유로 설명해 드리겠습니다.


🍳 핵심 비유: "유니버설 셰프 (EAGLE)" 프로젝트

상상해 보세요. Unitree H1, G1, Fourier N1 등 서로 다른 로봇들은 마치 키가 크고 마른 사람, 키가 작고 통통한 사람, 팔이 긴 사람처럼 몸매 (구조) 가 완전히 다릅니다.

기존 방식은 이들에게 "각자 자신의 몸매에 맞는 레시피를 따로따로 배우게" 했습니다. 하지만 이 연구는 다음과 같은 새로운 방식을 제안합니다.

1. 문제: "왜 모두 같은 레시피를 못 배우지?"

로봇마다 다리가 길고 짧고, 관절이 많고 적습니다. 그래서 "걸어라"라는 명령을 내렸을 때, 큰 로봇은 큰 걸음을, 작은 로봇은 작은 걸음을 걸어야 합니다. 기존에는 이 차이를 고려하지 않고 한 가지 정책 (Policy) 으로 모든 로봇을 통제하려다 실패하거나, 로봇마다 다시 처음부터 훈련시켜야 했습니다.

2. 해결책: "유니버설 셰프 (Generalist) 와 전문가 (Specialist) 의 순환 훈련"

저자들은 EAGLE이라는 시스템을 만들었습니다. 이는 마치 요리 학교에서 일어나는 일과 같습니다.

  • 단계 1: 마스터 셰프 (Generalist) 가 등장합니다.
    • 모든 로봇 (다양한 몸매) 을 섞어서 한꺼번에 가르칩니다. 아직은 모든 로봇을 완벽하게 조종하지는 못하지만, "기본적인 걸음걸이"는 익힙니다.
  • 단계 2: 각 로봇별 '전문가 셰프' (Specialist) 를 파견합니다.
    • 마스터 셰프의 지식을 바탕으로, H1 전용 셰프, G1 전용 셰프 등을 따로 만듭니다.
    • 이들은 각자 자신의 로봇 (예: H1) 에만 집중해서 "내 몸매에 딱 맞는 완벽한 걷기"를 연습합니다.
  • 단계 3: 지식을 다시 모으는 '다시 배움' (Distillation).
    • 여기서 핵심입니다! 각 전문가 셰프가 배운 **특별한 비법 (H1 은 이렇게 걸어야 잘 걷고, G1 은 저렇게 걸어야 잘 걷는다는 것)**을 다시 마스터 셰프에게 가르칩니다.
    • 마스터 셰프는 이 새로운 비법들을 모두 합쳐서 "어떤 몸매든 상황에 맞춰 최적의 걸음걸이를 찾는" 초능력을 얻게 됩니다.
  • 단계 4: 반복.
    • 이 과정을 여러 번 반복하면, 마스터 셰프는 어느 로봇이든 한 번도 보지 않은 로봇이라도 즉시 잘 조종할 수 있게 됩니다.

🚀 이 기술의 놀라운 점 (기존과 다른 점)

  1. 단순 걷기만 하는 게 아닙니다.
    • 기존 로봇들은 "걸어라", "뛰어라" 정도만 할 수 있었습니다. 하지만 이 기술은 "쪼그려 앉기 (Squatting)", "몸을 기울이기 (Leaning)" 같은 복잡한 동작까지 한 번에 시킬 수 있습니다. 마치 로봇에게 "걸으면서 동시에 몸을 숙여라"라고 명령해도 척척 해낸다는 뜻입니다.
  2. 로봇마다 따로 레시피를 고칠 필요가 없습니다.
    • 새로운 로봇이 나오면 훈련을 처음부터 다시 할 필요가 없습니다. 기존에 훈련된 '마스터 셰프'에게 그 로봇의 몸매 정보만 알려주면, 바로 적응해서 작동합니다.
  3. 실제 로봇에서도 작동합니다.
    • 시뮬레이션 (가상 세계) 에서만 잘하는 게 아니라, 실제 Unitree H1, G1 등 4 가지 다른 로봇에 적용해 보았을 때도 **한 번도 보지 않은 로봇 (Zero-shot)**임에도 불구하고 매우 안정적으로 걷고, 앉고, 기울이는 모습을 보여주었습니다.

💡 요약하자면

이 논문은 **"서로 다른 몸매를 가진 로봇들"**을 위해 **"하나의 두뇌 (정책)"**를 개발했습니다.

그 방법은 마치 한 명의 천재 코치가, 각 운동선수의 체형에 맞춰 훈련시킨 뒤 그 노하우를 모두 모아 더 완벽한 코칭 스타일을 만들어내는 과정과 같습니다.

이제 우리는 로봇 하나하나를 따로따로 가르치는 번거로움 없이, 하나의 지능으로 다양한 로봇 군단 (Fleet) 을 한 번에 통제할 수 있는 시대가 열렸습니다. 이는 앞으로 공장, 병원, 재난 현장 등에서 다양한 로봇들이 협력하여 일할 수 있는 기반을 마련해 줍니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →