ACE-Brain-0: Spatial Intelligence as a Shared Scaffold for Universal Embodiments

이 논문은 다양한 물리적 구현체에 공통적으로 필요한 공간 지능을 공유 기반대로 활용하여, SSR(기반 구축 - 전문화 - 조화) 패러다임과 GRPO 최적화를 통해 자율 주행, 로봇, UAV 등을 아우르는 범용 embodied intelligence 모델인 ACE-Brain-0 을 제안하고 다양한 벤치마크에서 최첨단 성능을 입증했습니다.

Ziyang Gong, Zehang Luo, Anke Tang, Zhe Liu, Shi Fu, Zhi Hou, Ganlin Yang, Weiyun Wang, Xiaofeng Wang, Jianbo Liu, Gen Luo, Haolan Kang, Shuang Luo, Yue Zhou, Yong Luo, Li Shen, Xiaosong Jia, Yao Mu, Xue Yang, Chunxiao Liu, Junchi Yan, Hengshuang Zhao, Dacheng Tao, Xiaogang Wang

게시일 2026-03-04
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🚗🤖🚁 문제: "모두를 한 번에 가르치면 왜 망할까?"

생각해 보세요. 한 명의 선생님에게 자율주행차, 드론, 로봇 세 가지 학생을 동시에 가르친다고 상상해 봅시다.

  1. 자율주행차는 도로의 차선과 신호를 보고 "앞으로 가자"고 생각합니다.
  2. 드론은 하늘에서 건물의 높이를 보고 "회전해서 날아라"고 생각합니다.
  3. 로봇은 책상 위를 보고 "컵을 잡으라"고 생각합니다.

이 세 학생은 **생각하는 방식 (데이터)**이 너무 다릅니다. 만약 선생님이 이들을 한 반에 섞어서 가르치면 (기존 방식), 자율주행차의 "차선" 지식이 드론의 "하늘" 지식을 방해하고, 로봇의 "손가락" 지식이 차선 지식을 잊게 만들 수 있습니다. 이를 **'경쟁하는 생각 (Gradient Interference)'**과 **'기억 상실 (Catastrophic Forgetting)'**이라고 합니다.

💡 해결책: "공통된 기초 체력 (공간 지능)"을 먼저 키워라!

저자들은 이 문제를 해결하기 위해 ACE-Brain-0을 만들었습니다. 핵심 아이디어는 **"모든 기계는 '공간'을 이해하는 공통된 뇌가 필요하다"**는 것입니다.

  • 차가 길을 가려면 3D 공간의 거리를 알아야 하고,
  • 드론이 날려면 3D 공간의 높이를 알아야 하며,
  • 로봇이 물건을 잡으려면 3D 공간의 위치를 알아야 합니다.

즉, **모든 기계에게 공통적으로 필요한 '공간 지능 (Spatial Intelligence)'**이라는 기초 체력을 먼저 키워주는 것이 핵심입니다.

🏗️ ACE-Brain-0 의 3 단계 훈련법: "SSR" 전략

이 모델은 **SSR (Scaffold-Specialize-Reconcile)**이라는 3 단계 훈련법을 사용합니다. 이를 건축 프로젝트에 비유해 볼까요?

1 단계: 발판 세우기 (Scaffold - 기초 공사)

  • 비유: 모든 건물을 짓기 전에 **튼튼한 기초 (Space)**를 먼저 다집니다.
  • 내용: 먼저 '공간 지능'만 전문적으로 가르칩니다. "물체 사이의 거리는?", "위치가 어디지?", "어떤 방향이지?" 같은 질문만 반복해서 학습시킵니다. 이렇게 하면 모델은 어떤 형태의 기계가 되든 상관없이 3D 공간을 이해하는 공통된 뇌를 갖게 됩니다.

2 단계: 전문가 양성 (Specialize - 각자 전공 공부)

  • 비유: 기초가 잡힌 상태에서 각자 전공을 따로 공부시킵니다.
  • 내용: 이제 기초를 바탕으로 각자 전문가가 됩니다.
    • 자율주행 전문가: 도로와 교통 규칙을 배웁니다.
    • 드론 전문가: 하늘과 지형 분석을 배웁니다.
    • 로봇 전문가: 물건 조작과 손놀림을 배웁니다.
    • 중요한 점: 이때는 서로 섞이지 않고 각자 따로 공부합니다. 그래서 서로의 지식이 섞여서 망가지는 것을 막습니다.

3 단계: 통합 및 조화 (Reconcile - 한 팀으로 합치기)

  • 비유: 각자 전공을 마친 전문가들을 한 팀으로 합쳐서 시너지를 냅니다.
  • 내용: 이제 따로 공부한 세 명의 전문가 (자율주행, 드론, 로봇) 의 지식을 하나로 합칩니다. 단순히 섞는 게 아니라, 데이터 없이도 각자의 지식이 서로를 방해하지 않고 조화롭게 작동하도록 '머리'를 맞춥니다.
    • 결과: 자율주행도 잘하고, 드론도 잘하고, 로봇도 잘하는 만능 두뇌가 탄생합니다.

🌟 추가 기술: "GRPO" (스마트한 피드백)

마지막으로, 이 모델에게 GRPO라는 기술을 적용합니다.

  • 비유: 학생이 문제를 풀 때, 정답만 알려주는 게 아니라 "네가 푼 5 가지 답안 중 가장 좋은 답은 무엇이고, 왜 그 답이 좋은지" 스스로 비교하게 합니다.
  • 효과: 이렇게 하면 모델이 복잡한 상황에서 더 똑똑한 결정을 내리고, 실수를 스스로 수정하는 능력을 키울 수 있습니다.

🏆 결과: 얼마나 잘할까?

이 모델은 24 개의 시험에서 다른 최신 모델들보다 훨씬 좋은 성적을 냈습니다.

  • 공간 감각: 물체 사이의 거리를 재거나, 3D 지도를 머릿속에 그리는 능력이 탁월합니다.
  • 자율주행: 복잡한 도로 상황에서 다음 행동을 예측하고 설명하는 능력이 뛰어납니다.
  • 드론: 하늘에서 본 풍경을 보고 건물의 높이나 차량의 위치를 정확히 파악합니다.
  • 로봇: "컵을 가져와"라는 명령을 듣고 실제로 손으로 잡는 행동을 계획합니다.

📝 한 줄 요약

"ACE-Brain-0 은 자율주행차, 드론, 로봇 등 서로 다른 기계들이 모두 똑똑해지도록, 먼저 '공간을 이해하는 공통된 기초 체력'을 키워주고, 그 위에 각자의 전문 기술을 따로 가르친 뒤, 마지막으로 이 모든 지식을 하나로 자연스럽게 합친 '만능 두뇌'입니다."

이 기술은 앞으로 우리가 만드는 모든 로봇과 기계가 서로 다른 환경에서도 유연하게 적응하고 똑똑하게 행동할 수 있는 길을 열어줍니다.