PhaForce: Phase-Scheduled Visual-Force Policy Learning with Slow Planning and Fast Correction for Contact-Rich Manipulation

이 논문은 저주파 시각 기반 계획과 고주파 힘 기반 보정을 통합한 위상 기반 시각 - 힘 정책 'PhaForce'를 제안하여, 접촉이 풍부한 조작 작업에서 기존 방법 대비 성공률을 40% 포인트 향상시키고 접촉 품질과 적응성을 크게 개선했음을 보여줍니다.

Mingxin Wang, Zhirun Yue, Renhao Lu, Yizhe Li, Zihan Wang, Guoping Pan, Kangkang Dong, Jun Cheng, Yi Cheng, Houde Liu

게시일 2026-03-10
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🤖 로봇의 딜레마: "눈만 믿을지, 손끝을 믿을지?"

상상해 보세요. 로봇이 전선 꽂기서랍 열기 같은 일을 하고 있습니다.

  • **눈 (카메라)**은 멀리서 보는 거예요. "아, 구멍이 저기 있네!"라고 알려주지만, 구멍에 꽂히는 순간의 미세한 '끼임'이나 '미끄러짐'은 눈으로 구별하기 어렵습니다.
  • **손끝 (힘/토크 센서)**은 아주 민감하게 반응합니다. "아, 너무 세게 밀고 있네!" 혹은 "아, 살짝 비틀렸네!"라고 즉각 알려주죠.

기존의 로봇들은 **눈 (시각)**에만 너무 의존하거나, 힘 센서 데이터를 처리하는 속도가 너무 느려서 "아, 끼였네!"라고 깨닫는 순간 이미 늦어버리는 경우가 많았습니다. 마치 운전하면서 앞만 보고 핸들을 돌리는 것과 같아서, 갑자기 튀어나온 장애물을 피할 때 반응이 늦는 셈이죠.

💡 PhaForce 의 해결책: "느린 계획가"와 "빠른 수리공"의 팀워크

PhaForce 는 이 문제를 해결하기 위해 로봇에게 두 명의 전문가를 배치했습니다.

1. 느린 계획가 (Slow Planner) - "지도 보는 전략가"

  • 역할: 로봇의 전체적인 움직임을 미리 계획합니다. (예: "일단 서랍 쪽으로 가자.")
  • 특징: 생각할 시간이 좀 걸리지만 (6Hz), **눈 (시각)**을 주력으로 삼습니다. 하지만 힘 센서 데이터도 "어떤 단계에 있는지"를 고려해서 아주 조심스럽게 참고합니다.
  • 비유: 여행을 계획하는 여행사 대표입니다. "오늘은 산을 오를 거야"라고 큰 그림을 그립니다. 하지만 등산 중 돌이 튀어나오면 바로 발을 떼는 건 아니죠.

2. 빠른 수리공 (Fast Corrector) - "즉각 반응하는 수리공"

  • 역할: 계획된 움직임이 틀어지면 순간순간 바로 고쳐줍니다. (예: "아, 너무 세게 밀고 있네! 살짝 빼자.")
  • 특징: 매우 빠릅니다 (24Hz). 눈은 보지 않고 손끝의 힘에만 집중해서 미세한 조정을 합니다.
  • 비유: 운전 중 핸들을 미세하게 조작하는 운전사입니다. "아, 차가 살짝 미끄러지네?" 하면 즉시 핸들을 돌려 길을 잡죠.

🔑 핵심 기술: "상황에 맞는 지시" (Phase-Scheduled)

이 두 전문가가 서로 싸우지 않고 잘 협력하게 만드는 것이 이 기술의 핵심입니다. 바로 "상황 (Phase)"을 아는 것입니다.

  • 상황 1: 구멍 찾기 (Search)
    • 로봇이 구멍을 찾을 때는 **좌우 (X, Y)**로 살짝 움직여야 합니다. 이때는 힘 센서가 "여기 맞았어!"라고 알려주면 바로 반응해야 합니다.
  • 상황 2: 꽂기 (Insert)
    • 구멍에 꽂을 때는 **아래 (Z)**로 힘을 주면서 밀어야 합니다. 이때 좌우로 움직이면 오히려 끼일 수 있습니다.

PhaForce 의 마법:
로봇은 **"지금 내가 어떤 단계인가?"**를 스스로 판단합니다.

  • "아, 이제 구멍 찾기 단계구나!" → 빠른 수리공이 "좌우로 움직여라"라고 지시합니다.
  • "아, 이제 꽂기 단계구나!" → 빠른 수리공이 "아래로만 밀어라"라고 지시합니다.

만약 이 지시가 없다면, 로봇이 꽂는 단계에서도 좌우로 흔들다가 구멍에 끼여버리는 (Jamming) 실수를 저지를 수 있습니다. PhaForce 는 이 단계별 지시를 통해 로봇이 언제, 어디에 힘을 써야 할지 정확히 알려줍니다.

🏆 실제 성과: 얼마나 잘할까요?

이 기술을 실제 로봇에 적용해 보니 놀라운 결과가 나왔습니다.

  1. 성공률 대폭 상승: 기존 로봇들이 60% 정도 성공하던 일을, 이 기술은 **86%**까지 성공률을 높였습니다. (약 40% 포인트 향상!)
  2. 예상치 못한 상황에도 강함: 실험실에서는 책상 높이가 10cm 였는데, 실제 사용 시 13cm 로 바뀌어도 (OOD 상황) 로봇이 힘 센서를 이용해 "아, 높이가 다르네? 힘을 조절해서 맞춰야지"라고 스스로 적응했습니다. 기존 로봇들은 이때 완전히 멈춰버리거나 벽을 밀어대서 실패했습니다.
  3. 부드러운 작업: 서랍을 열거나 닦을 때, 너무 세게 누르거나 너무 약해서 떨어지는 일이 거의 없었습니다. 마치 숙련된 장인이 작업하는 것처럼 부드럽습니다.

📝 한 줄 요약

PhaForce는 로봇에게 "눈으로 큰 그림을 그리되 (Slow), 손끝의 느낌을 통해 순간순간 미세하게 수정하는 (Fast)" 능력을赋予了, 특히 단계별로 힘의 쓰임새를 지능적으로 조절하게 함으로써, 복잡한 물체 조작 (전선 꽂기, 서랍 열기 등) 에서 인간처럼 유연하고 정확한 작업을 가능하게 만든 기술입니다.

마치 숙련된 요리사가 큰 칼질 (계획) 은 눈으로 하지만, 소금 간을 맞추거나 재료를 다질 때는 손끝의 감각 (힘) 을 이용해 즉각적으로 조절하는 것과 같은 원리입니다.