Uni-Skill: Building Self-Evolving Skill Repository for Generalizable Robotic Manipulation

이 논문은 고정된 기술 라이브러리의 한계를 극복하고 대규모 로봇 비디오에서 자동으로 추출된 계층적 기술 저장소 (SkillFolder) 를 통해 새로운 작업을 자동 구현하며 Few-shot 추론을 가능하게 하는 자기 진화형 범용 로봇 조작 프레임워크인 Uni-Skill 을 제안합니다.

Senwei Xie, Yuntian Zhang, Ruiping Wang, Xilin Chen

게시일 2026-03-04
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"로봇이 새로운 일을 배울 때, 인간이 일일이 가르치지 않아도 스스로 지식을 쌓아갈 수 있게 해주는 시스템"**에 대한 이야기입니다.

기존의 로봇은 마치 정해진 레시피만 있는 요리사와 같았습니다. "계란 프라이를 해줘"라고 하면 해줄 수 있지만, "새로운 소스를 만들어줘"라고 하면 "저는 그 레시피를 몰라요"라고 답하며 멈춰버렸습니다.

이 논문에서 제안한 **Uni-Skill(유니-스킬)**은 그 정해진 레시피를 넘어서, **스스로 새로운 레시피를 찾아내고 만들어내는 '요리사'**입니다.

이 시스템을 이해하기 쉽게 세 가지 비유로 설명해 드릴게요.


1. 문제점: "고정된 도구상자"의 한계

기존 로봇들은 미리 정해진 도구상자 (스킬 라이브러리) 만 가지고 있었습니다.

  • 상황: 로봇에게 "책상을 닦아줘"라고 시켰는데, 로봇의 도구상자에는 '접시 닦기'는 있지만 '책상 닦기' 도구가 없었습니다.
  • 결과: 로봇은 당황해서 아무것도 못 하거나, 인간이 "책상 닦는 법을 새로 가르쳐줘"라고 일일이 시켜야만 했습니다.

2. 해결책 1: "스스로 부족함을 아는 계획가" (Skill-Aware Planning)

Uni-Skill 의 첫 번째 핵심은 스스로 "내가 이 일을 하려면 무언가가 부족해!"라고 깨닫는 능력입니다.

  • 비유: 마치 현명한 요리사가 손님이 "이국적인 요리를 만들어줘"라고 하면, 자신의 주머니를 뒤져보며 "아, 이 요리를 하려면 내가 가진 '양념'은 있지만 '특수 소스'가 없구나!"라고 알아챕니다.
  • 작동 원리: 로봇은 "책상 닦기"라는 명령을 받으면, 기존에 아는 '접시 닦기'만으로는 부족하다고 판단합니다. 그리고 스스로 **"아, '책상 닦기'라는 새로운 스킬이 필요해!"**라고 정의하고, 그 스킬이 어떤 것인지 (예: "스펀지로 원을 그리며 닦는 것") 언어로 설명해냅니다.

3. 해결책 2: "거대한 인터넷 도서관" (SkillFolder)

새로운 스킬을 정의했으니, 이제 실제로 어떻게 하는지 배워야 합니다. 여기서 Uni-Skill 은 SkillFolder라는 거대한 도서관을 활용합니다.

  • 비유: 이 도서관은 수십만 개의 요리 시연 영상 (유튜브 등) 이 쌓인 곳입니다. 하지만 기존에는 이 영상들이 제목도 없이 뒤죽박죽 섞여 있어 찾기 힘들었습니다.
  • 혁신: Uni-Skill 은 이 영상들을 VerbNet(동사 사전) 이라는 체계적인 분류법을 이용해 정리했습니다.
    • "닦다" → "원형으로 닦다" → "스펀지로 책상 닦기" 처럼 계층적으로 정리된 것입니다.
    • 로봇이 "책상 닦기"가 필요하다고 말하면, 이 도서관에서 가장 비슷한 예시 영상 (예: 누군가 스펀지로 테이블을 닦는 모습) 을 순식간에 찾아냅니다.

4. 해결책 3: "모방하며 배우는 학생" (Few-Shot Implementation)

찾아낸 예시 영상을 보고 로봇은 직접 실행합니다.

  • 비유: 요리사가 새로운 요리를 배울 때, **유튜브 영상을 보며 "아, 저 사람은 이렇게 손목을 돌리네? 나도 저렇게 해보자"**라고 따라 하는 것과 같습니다.
  • 작동 원리: 로봇은 찾아낸 예시 영상의 **움직임 궤적 (어떻게 손이 움직였는지)**과 **의미 (어떤 물체를 잡아야 하는지)**를 분석합니다. 그리고 이를 바탕으로 인간이 실물을 보여줄 필요 없이, 단 몇 번의 예시만으로도 새로운 일을 척척 해냅니다.

🌟 요약: Uni-Skill 이 왜 특별한가요?

  1. 스스로 배우는 능력: 새로운 일이 생기면 "모르겠다" 하고 멈추는 게 아니라, "내가 뭘 더 배워야 할지 스스로 정의하고, 인터넷에서 예시를 찾아 배웁니다."
  2. 유연한 사고: "접시 닦기"만 알던 로봇이, "책상 닦기"나 "옷 개기" 같은 완전히 새로운 일도 비슷한 원리를 적용해 해낼 수 있습니다.
  3. 실제 성과: 컴퓨터 시뮬레이션과 실제 로봇 실험에서, 기존 최신 기술들보다 새로운 일을 성공적으로 해내는 비율이 20~30% 이상 높았습니다.

결론적으로, Uni-Skill 은 로봇에게 **"정해진 레시피만 따르는 기계"**가 아니라, **"새로운 요리를 보고 배우고, 스스로 레시피를 만들어내는 창의적인 요리사"**의 능력을 선물한 기술입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →