D-REX: Differentiable Real-to-Sim-to-Real Engine for Learning Dexterous Grasping

이 논문은 가우스 스플랫을 활용한 차분 가능한 엔진을 통해 실제 시각 관측과 로봇 제어 신호로부터 물체 질량을 자동으로 식별하고 이를 기반으로 힘 인식 그리핑 정책을 학습함으로써 시뮬레이션과 현실 간의 격차를 효과적으로 해소하는 'D-REX' 시스템을 제안합니다.

Haozhe Lou, Mingtong Zhang, Haoran Geng, Hanyang Zhou, Sicheng He, Zhiyuan Gao, Siheng Zhao, Jiageng Mao, Pieter Abbeel, Jitendra Malik, Daniel Seita, Yue Wang

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

D-REX: 로봇이 "무게감"을 눈으로 알아내는 마법 같은 기술

이 논문은 D-REX라는 새로운 로봇 기술을 소개합니다. 쉽게 말해, "실제 세상을 보고 시뮬레이션 (가상 세계) 을 만들고, 다시 실제 로봇에 적용하는" 놀라운 시스템입니다.

로봇이 물건을 잡을 때 가장 큰 문제는 **"이 물건이 얼마나 무거울까?"**를 모른다는 점입니다. 시뮬레이션에서 로봇을 훈련시킬 때는 가상의 물체 무게를 임의로 설정하지만, 실제 세상으로 가져가면 그 무게가 다르면 로봇은 물건을 떨어뜨리거나 너무 세게 잡아서 부숴버립니다.

D-REX 는 이 문제를 해결하기 위해 세 가지 마법 같은 단계를 거칩니다.


1 단계: 눈으로 본 것을 가상 세계에 재현하기 (Real-to-Sim)

비유: "실제 사물을 3D 프린터로 찍어내는 것"

우리가 스마트폰으로 물체 주변을 돌며 영상을 찍으면, D-REX 는 그 영상을 분석해 **완벽한 3D 가상 복제본 (디지털 트윈)**을 만듭니다.

  • 어떻게? '가우스 스플래팅 (Gaussian Splatting)'이라는 최신 기술을 써서, 물체의 모양과 질감을 마치 실제 사진처럼 아주 정교하게 재현합니다.
  • 결과: 로봇이 시뮬레이션 안에서 보는 물건은 실제 물건과 모양이 똑같아집니다.

2 단계: 눈으로 '무게'를 추리하기 (Mass Identification)

비유: "저울 없이도 무게를 알아내는 명탐정"

이게 이 기술의 핵심입니다. 보통 물건의 무게는 저울로 재야 알 수 있지만, D-REX 는 **로봇이 물건을 살짝 밀거나 잡는 모습 (영상)**만 보고 무게를 계산해냅니다.

  • 작동 원리:
    1. 로봇이 시뮬레이션과 실제 세상에서 똑같은 동작 (예: 물건을 밀기) 을 합니다.
    2. 만약 시뮬레이션 속 가상의 물체가 실제보다 가볍다면, 로봇이 밀었을 때 물체가 더 멀리 날아갈 것입니다.
    3. D-REX 는 이 **차이점 (오차)**을 분석하며, "아, 가상의 무게를 조금 더 늘려야 실제와 같아지겠구나!"라고 스스로 학습합니다.
    4. 마치 저울을 사용하지 않고도, 물체의 움직임을 보고 무게를 정확히 맞춰내는 수학적인 추리를 하는 셈입니다.

3 단계: 무게를 알고 나서 잡기 (Force-Aware Policy)

비유: "무거운 물체는 꽉 잡고, 가벼운 물체는 살살 잡는 지혜"

이제 로봇은 물건의 정확한 무게를 알게 되었습니다. 이 정보를 바탕으로 힘 조절이 가능한 잡기 기술을 배웁니다.

  • 기존 로봇: 무조건 같은 힘으로 잡습니다. 무거운 물건을 잡으면 미끄러지고, 가벼운 물건을 잡으면 너무 세게 잡아 부숩니다.
  • D-REX 로봇: "이건 700g 이네? 그럼 힘을 좀 더 세게 줘야겠다." 혹은 "이건 50g 이네? 살살 잡아야겠다."라고 상황에 맞게 힘을 조절합니다.
  • 인간 시연 활용: 사람이 물건을 잡는 영상을 찍어주면, 로봇은 그 영상을 보고 "사람은 이렇게 잡았구나"라고 배운 뒤, 자신이 알아낸 무게 정보를 더해 최적의 잡는 법을 스스로 완성합니다.

왜 이것이 중요한가요?

기존에는 로봇을 실제 세상에 적용하려면 수천 번의 실패와 수정이 필요했습니다. 하지만 D-REX 는 실제 영상을 보고 시뮬레이션을 완벽하게 맞추고, 무게까지 정확히 계산해내기 때문에, 로봇이 처음부터 아주 잘 잡을 수 있게 됩니다.

한 줄 요약:

D-REX 는 로봇에게 **"눈으로 보고 무게를 추리하는 능력"**과 **"무게에 맞춰 힘을 조절하는 지혜"**를 가르쳐서, 시뮬레이션과 현실의 벽을 허무는 기술입니다.

이 기술이 발전하면, 로봇이 우리 집 냉장고에서 무거운 병을 꺼내거나, 약한 장난감을 부수지 않고 잡는 등 훨씬 더 똑똑하고 안전한 일상 생활을 도와줄 수 있을 것입니다.