CORAL: Scalable Multi-Task Robot Learning via LoRA Experts

이 논문은 여러 작업 간 간섭을 방지하고 새로운 작업을 순차적으로 학습할 수 있도록 단일 VLA 백본에 작업별 경량 LoRA 전문가를 동적으로 연결하는 확장 가능한 로봇 학습 프레임워크 'CORAL'을 제안합니다.

Yuankai Luo, Woping Chen, Tong Liang, Zhenguo Li

게시일 Wed, 11 Ma
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🤖 로봇이 "만능 천재"가 되는 방법: CORAL 이야기

우리가 로봇에게 "책상 정리해 줘", "커피 가져와 줘", "창문 열어 줘" 등 다양한 일을 시키려고 할 때, 기존 방식에는 두 가지 큰 문제가 있었습니다.

  1. 혼란 (간섭): 모든 일을 한 번에 배우게 하면, 로봇이 "책상 정리"를 배우는 중에 "커피 가져오기"를 잊어버리거나, 두 가지 명령이 서로 충돌해서 엉망이 됩니다. (예: "책상 정리"를 하다가 커피를 쏟는 상황)
  2. 저장 공간 부족: 각 일마다 로봇을 따로 따로 훈련시켜서 따로 저장해 두려면, 로봇의 뇌 (메모리) 가 감당할 수 없을 정도로 커져버립니다.

CORAL은 이 두 가지 문제를 해결하기 위해 매우 똑똑하고 효율적인 방법을 고안했습니다.

🍳 비유: "마스터 셰프"와 "전공 요리사"

이 시스템을 이해하기 위해 요리사 비유를 들어볼까요?

  • 기존 방식 (한 번에 모두 배우기):
    한 명의 요리사에게 "중식, 일식, 양식, 디저트"를 모두 동시에 배우게 합니다. 문제는 요리사 머릿속이 너무 복잡해져서, 중식을 만들다가 일식 레시피를 잊어버리거나, 재료들을 섞어서 이상한 요리를 만들어낸다는 것입니다.

  • 기존 방식 2 (각자 따로 배우기):
    중식 요리사, 일식 요리사, 양식 요리사를 각각 따로 뽑아 따로 훈련시킵니다. 일은 잘하지만, 식당에 요리사가 100 명이나 필요하면 주방이 너무 비좁아지고 관리 비용이 천문학적으로 늘어납니다.

  • CORAL 방식 (마스터 셰프 + 전공 요리사):
    CORAL 은 **한 명의 '마스터 셰프 (기본 모델)'**를 두고, 그 옆에 **작은 '전공 요리사 (LoRA 전문가)'**들만 따로 둡니다.

    • 마스터 셰프: 로봇의 기본 지능입니다. "손을 어떻게 움직여야 하는지", "물체가 무엇인지" 같은 기본적인 상식과 신체 능력을 이미 완벽하게 익혀 있습니다. 이 마스터 셰프는 절대 변하지 않고 고정되어 있습니다.
    • 전공 요리사 (LoRA): "중식 전문", "일식 전문", "디저트 전문"처럼 매우 작고 가벼운 전문가들입니다. 이들은 마스터 셰프의 옆에 붙어, 특정 요리 (작업) 만 아주 빠르게 가르칩니다.

🚀 어떻게 작동할까요? (CORAL 의 3 가지 핵심)

1. "명령어"로 바로 연결하기 (스마트한 지시)
고객이 "초밥 만들어 줘!"라고 말하면, 로봇은 그 말만 듣고 바로 옆에 있는 **'일식 전공 요리사'**를 불러옵니다.

  • 기존의 복잡한 방식: "어떤 일을 해야 할지 AI 가 고민해서 결정해야 함" (이 과정에서 시간이 걸리고 실수할 수 있음).
  • CORAL 의 방식: "초밥"이라는 말 자체가 이미 "일식 요리사"를 부르는 열쇠입니다. 그래서 어떤 일을 해야 할지 고민할 필요도, 복잡한 계산도 없이 바로 해당 전문가를 켭니다.

2. "제로 (Zero)" 간섭 (서로 방해 안 함)
일식 요리사가 초밥을 만들 때, 중식 요리사는 그 옆에서 잠을 자고 있습니다. 서로의 레시피 (기억) 가 섞이지 않기 때문에, 어떤 일을 배우든 다른 일은 절대 망가지지 않습니다.

  • 로봇이 새로운 일을 배워도, 이전에 배운 일은 100% 그대로 유지됩니다. (잊어버림 현상 해결)

3. "초경량" 저장 (주방 공간 절약)
각 전공 요리사 (전문가) 는 아주 작습니다. 전체 로봇 뇌의 크기를 100 이라고 한다면, 한 명의 전공 요리사는 1 정도밖에 안 됩니다.

  • 그래서 100 가지 일을 하더라도, 100 개의 무거운 로봇을 저장할 필요가 없습니다. 하나의 기본 로봇 + 100 개의 작은 메모리 카드만 있으면 됩니다. 저장 공간이 100 배나 절약되는 셈입니다.

🌟 실제 성과: 로봇이 얼마나 잘하나요?

이론만 좋은 게 아니라, 실제 실험에서도 놀라운 결과를 보였습니다.

  • 시뮬레이션 테스트: 다양한 로봇 (LIBERO, WidowX 등) 이 복잡한 미션을 수행할 때, 기존 방식보다 훨씬 높은 성공률을 기록했습니다. 특히 "오래된 기억을 유지하면서 새로운 일을 배우는" 능력에서 압도적이었습니다.
  • 실제 로봇 실험: 실제 이원팔 로봇 (Galaxea R1) 에 적용했습니다.
    • 새로운 일 배우기: 문 여는 법, 엘리베이터 버튼 누르기 같은 완전히 새로운 일을 가르쳤을 때, 기존 방식은 다른 일을 잊어버리거나 실패했지만, CORAL 은 새로운 일도 잘하고, 예전 일도 잊지 않았습니다.
    • 저장 공간: 기존에 100 개의 로봇을 저장해야 할 공간을, CORAL 은 하나의 로봇과 작은 파일들로 해결했습니다.

💡 결론: 왜 이것이 중요한가요?

CORAL 은 로봇이 **평생 학습 (Lifelong Learning)**을 할 수 있게 해주는 열쇠입니다.

  • 기존: 로봇을 한 번 훈련하면 그 일만 잘하고, 새로운 일을 배우려면 다시 처음부터 훈련하거나 메모리가 터집니다.
  • CORAL: 로봇은 기본 지능은 그대로 유지한 채, 필요할 때마다 작은 '전문가'를 꺼내서 새로운 일을 즉시 배울 수 있습니다. 그리고 그 기억은 영구적으로 남습니다.

이 기술이 상용화되면, 우리 집 로봇은 아침에는 커피를 내리고, 점심에는 설거지를 하고, 저녁에는 아이와 놀아주는 등 수십 가지 일을 자연스럽게 해내면서도, 기억력도 좋고 저장 공간도 적게 차지하게 될 것입니다.

한 줄 요약:

**"변하지 않는 기본 지능 (마스터) 위에, 필요한 일마다 작은 전문가 (LoRA) 를 붙여서, 로봇이 잊지 않고, 공간을 차지하지 않고, 모든 일을 척척 해내는 시스템"**입니다.