Omni-Manip: Beyond-FOV Large-Workspace Humanoid Manipulation with Omnidirectional 3D Perception

본 논문은 시야각 제한과 자기 가려짐 문제를 해결하기 위해 360 도 라이다 기반의 전방향 3D 지각과 시간 인식 어텐션 풀링을 활용한 엔드투엔드 비주얼 모터 정책 'Omni-Manip'을 제안하여, 로봇의 재배치 없이도 넓은 작업 공간에서 견고한 조작을 가능하게 합니다.

Pei Qu, Zheng Li, Yufei Jia, Ziyun Liu, Liang Zhu, Haoang Li, Jinni Zhou, Jun Ma

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"로봇이 눈앞에 보이지 않는 물체도 알아서 잡을 수 있게 만든 획기적인 기술"**에 대해 설명합니다.

기존의 로봇들은 마치 안경을 쓴 사람처럼, 눈앞에 있는 것만 보고 움직였습니다. 하지만 이 논문의 저자들은 로봇에게 **360 도 회전하는 '초능력 눈'**을 달아주어, 시야 밖의 물체도 안전하게 잡을 수 있게 했습니다.

이 기술을 쉽게 이해할 수 있도록 일상적인 비유로 설명해 드릴게요.


1. 문제점: "안경 쓴 로봇의 고충"

기존의 로봇들은 머리에 **카메라 (RGB-D)**만 달고 있었습니다.

  • 비유: 마치 좁은 창문을 통해 밖을 내다보는 사람과 같습니다.
  • 상황: 로봇이 물건을 옮기려는데, 목표 물체가 로봇의 시야 (창문) 밖으로 살짝만 벗어나도, 로봇은 "아, 저게 뭐지? 어디 있지?" 하며 당황합니다.
  • 결과: 로봇은 물건을 잡으려면 몸을 계속 돌려야 하고, 이 과정에서 넘어지거나 다른 물건을 부수는 사고가 자주 일어납니다. 마치 좁은 방에서 뒤도 돌아보지 않고 물건을 옮기려다 부딪히는 상황과 비슷합니다.

2. 해결책: "360 도 회전하는 초능력 눈 (LiDAR)"

이 논문이 제안한 **'Omni-Manip(오미-매니프)'**는 로봇에게 **라이더 (LiDAR)**라는 장치를 달아주었습니다.

  • 비유: 로봇이 **머리 위에 360 도 회전하는 '파라솔'**을 쓰고 있다고 상상해 보세요. 이 파라솔은 빛을 쏘아 주변 모든 사물의 모양과 거리를 실시간으로 파악합니다.
  • 효과: 로봇은 이제 뒤쪽, 옆쪽, 머리 위까지 한눈에 다 볼 수 있습니다. 시야 밖 (창문 밖) 에 있는 물체도 "아, 저기 있구나!"라고 정확히 알고 접근할 수 있습니다.

3. 핵심 기술: "과거의 기억을 더하는 지능"

라이더로 얻은 데이터는 순간순간 깜빡일 수 있어 불안정할 수 있습니다. 그래서 논문은 **'시간 인식 어텐션 풀링 (Time-Aware Attention Pooling)'**이라는 기술을 썼습니다.

  • 비유: 마치 영화의 연속된 장면을 보는 것과 같습니다. 한 장의 사진만 보면 흐릿할 수 있지만, 1 초 전, 2 초 전의 장면을 이어 붙여 보면 사물이 어떻게 움직이는지 선명하게 보입니다.
  • 효과: 로봇은 과거의 데이터를 기억하며 "아, 저 물체가 조금 전엔 여기 있었는데, 지금 저기로 움직였구나"라고 예측하며 훨씬 안정적으로 움직입니다.

4. 학습 방법: "VR 게임으로 가르치기"

로봇에게 이 기술을 가르치기 위해 저자들은 전신 원격 조종 시스템을 개발했습니다.

  • 비유: 사람이 VR(가상현실) 고글을 쓰고 게임 하듯이 로봇을 조종하는 것입니다.
  • 과정: 사람이 VR 고글을 쓰고 "이제 로봇이 저기 있는 물건을 집어와"라고 명령하면, 로봇은 사람의 손과 발 움직임을 그대로 따라 합니다. 이렇게 수많은 데이터를 모아서 로봇 스스로 "어떻게 움직여야 물건을 잘 잡을지"를 배웁니다.

5. 실제 성과: "어지러운 방에서도 척척"

실험 결과, 이 로봇은 기존 로봇들보다 훨씬 뛰어났습니다.

  • 시야 밖의 물건: 카메라로 보이지 않는 뒤쪽의 병을 집어와서 다른 곳으로 옮기는 작업도 성공했습니다.
  • 장애물 회피: 주변에 물건이 어지럽게 널려 있어도, 로봇은 360 도 시야를 통해 "아, 저기 장애물이 있네"라고 피하며 안전하게 이동했습니다.
  • 비유: 어지러운 방에서 눈만 가리고 물건을 찾으면 넘어지지만, 이 로봇은 눈을 감지 않고도 주변을 훑어보며 물건을 찾아내어 부딪히지 않고 옮기는 것입니다.

요약

이 논문은 **"로봇에게 좁은 창문 대신 360 도 회전하는 파노라마 창을 달아주자, 로봇이 더 이상 시야 밖의 물체를 두려워하지 않고, 복잡한 환경에서도 안전하게 일할 수 있게 되었다"**는 이야기입니다.

이 기술은 앞으로 우리 집이나 복잡한 공장, 재난 현장 등에서 로봇이 더 자유롭게 일할 수 있는 기반을 마련해 줄 것으로 기대됩니다.