MolmoSpaces: A Large-Scale Open Ecosystem for Robot Navigation and Manipulation

이 논문은 로봇 정책의 대규모 벤치마킹을 지원하기 위해 23 만 개 이상의 다양한 실내 환경과 13 만 개의 풍부하게 주석된 객체를 포함하는 오픈 생태계 'MolmoSpaces'와 이를 활용한 벤치마크 'MolmoSpaces-Bench'를 소개하며, 높은 시뮬레이션 - 현실 상관관계를 입증하고 로봇 학습 연구를 위한 확장 가능한 데이터 생성 및 정책 훈련의 기반을 마련합니다.

Yejin Kim, Wilbert Pumacay, Omar Rayyan, Max Argus, Winson Han, Eli VanderBilt, Jordi Salvador, Abhay Deshpande, Rose Hendrix, Snehal Jauhri, Shuo Liu, Nur Muhammad Mahi Shafiullah, Maya Guru, Ainaz Eftekhar, Karen Farley, Donovan Clay, Jiafei Duan, Arjun Guru, Piper Wolters, Alvaro Herrasti, Ying-Chun Lee, Georgia Chalvatzaki, Yuchen Cui, Ali Farhadi, Dieter Fox, Ranjay Krishna

게시일 2026-02-20
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

몰모스페이스 (MolmoSpaces): 로봇을 위한 거대한 '가상 놀이터'

이 논문은 로봇이 현실 세계에서 더 똑똑하고 유연하게 일할 수 있도록 돕기 위해 만든 거대한 오픈소스 시뮬레이션 생태계를 소개합니다. 이를 쉽게 비유하자면, **"로봇들이 수백만 번의 실수를 안전하게 반복하며 배울 수 있는 거대한 가상 놀이터"**라고 생각하시면 됩니다.

1. 왜 이런 놀이터가 필요할까요? (문제점)

지금까지 로봇을 훈련시키기는 매우 어려웠습니다.

  • 현실은 너무 복잡합니다: 실제 집은 조명, 가구 배치, 물건 모양이 천차만별입니다. 로봇이 한 번 배운 것을 다른 집으로 가져가면 바로 망가질 수 있습니다.
  • 실제 실험은 비쌉니다: 로봇을 실제로 움직여 테스트하려면 시간이 오래 걸리고, 로봇이 부딪히면 고장 날 수도 있습니다.
  • 데이터가 부족합니다: 기존에는 로봇이 배울 수 있는 '가상 집'이나 '물건'의 종류가 너무 적었습니다. 마치 축구 선수가 오직 한 가지 경기장에서만 연습하고 다른 경기장에 나가면 당황하는 것과 비슷합니다.

2. 몰모스페이스는 무엇을 제공하나요? (해결책)

이 프로젝트는 로봇 학습을 위한 완벽한 도구상자를 제공합니다.

  • 23 만 개 이상의 다양한 가상 집 (Scenes):

    • 주방, 침실, 박물관, 카페 등 다양한 공간이 있습니다.
    • 단순히 방을 만드는 게 아니라, **LLM(거대 언어 모델)**이 창의적으로 가구를 배치하고 스타일을 입혀서, 현실에서 볼 수 있는 '지극히 드문 경우'까지 모두 포함했습니다.
    • 비유: 마치 "로봇이 평생 살아갈 수 있는 모든 종류의 집"을 미리 만들어 둔 것입니다.
  • 13 만 개 이상의 정교한 물건 (Objects):

    • 컵, 병, 문, 냉장고 등 13 만 가지 물건이 있습니다.
    • 이 물건들은 단순히 그림이 아니라, 물리 법칙을 따르는 3D 모델입니다. 로봇이 컵을 들면 무게를 느끼고, 문을 열면 경첩이 돌아가는 식으로 작동합니다.
    • 비유: 로봇이 만질 수 있는 '디지털 레고' 조각들이 수백만 개 준비되어 있는 셈입니다.
  • 4,200 만 개의 그립 (Grasps) 데이터:

    • 로봇이 물건을 잡을 때 "어디를 어떻게 잡아야 넘어지지 않을까?"에 대한 정답 데이터 4,200 만 개를 제공합니다.
    • 비유: 로봇이 물건을 잡는 '요령'을 4,200 만 가지 버전으로 가르쳐 주는 매뉴얼입니다.
  • 다양한 로봇과 시뮬레이터 지원:

    • 다양한 로봇 팔과 바퀴 달린 로봇을 지원하며, MuJoCo, Isaac Sim 등 유명한 시뮬레이션 프로그램 어디서든 작동합니다.

3. 이 놀이터에서 무엇을 할 수 있나요? (벤치마크)

연구자들은 이 놀이터에서 MolmoSpaces-Bench라는 시험을 만들었습니다.

  • 8 가지 기본 미션: "물건 찾기", "컵 들어 옮기기", "서랍 열기", "문 열기" 등 일상적인 임무들을 수행하게 합니다.
  • 0-shot(제로샷) 평가: 로봇에게 시험 문제를 미리 가르치지 않고, 처음 보는 상황에서도 얼마나 잘하는지 테스트합니다. 이는 로봇이 진짜로 '지능'을 갖췄는지 확인하는 핵심입니다.

4. 놀라운 결과: 가상과 현실의 연결

이 프로젝트의 가장 큰 성과는 가상 (Simulation) 과 현실 (Real World) 의 상관관계가 매우 높다는 것을 증명했습니다.

  • 비유: 로봇이 가상 놀이터에서 점수가 높으면, 실제 현실에서도 똑같이 잘한다는 뜻입니다. (상관관계 0.96~0.98)
  • 이는 연구자들이 실제 로봇을 움직이지 않고도, 가상 환경에서 수천 번의 실험을 통해 로봇의 성능을 정확히 예측하고 개선할 수 있음을 의미합니다.

5. 결론: 로봇의 미래를 여는 열쇠

MolmoSpaces는 로봇 연구자들에게 다음과 같은 기회를 줍니다.

  1. 대규모 학습: 수백만 개의 다양한 상황에서 로봇을 훈련시켜 '만능 로봇'을 만들 수 있습니다.
  2. 안전한 실패: 로봇이 실수해도 부러지지 않고, 그 실패를 통해 배우게 합니다.
  3. 공유와 발전: 누구나 이 데이터를 무료로 사용하여 더 좋은 로봇을 만들 수 있습니다.

한 줄 요약:

"로봇이 현실 세계의 복잡한 상황을 두려워하지 않고, 수백만 번의 가상 연습을 통해 스스로 배우고 성장할 수 있도록 만든 최고급 가상 훈련 시설입니다."

이제 로봇 연구자들은 더 이상 "어떻게 로봇을 훈련시킬까?"를 고민하기보다, "이 놀이터에서 로봇에게 어떤 새로운 미션을 줄까?"를 고민할 수 있게 되었습니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →