EmboTeam: Grounding LLM Reasoning into Reactive Behavior Trees via PDDL for Embodied Multi-Robot Collaboration

이 논문은 대형 언어 모델 (LLM) 의 추론 능력을 PDDL 기반의 행동 트리 및 반응형 제어에 통합하여 이종 로봇 팀의 장기적 협업 작업 성공률을 기존 대비 55% 로 획기적으로 향상시킨 'EmboTeam' 프레임워크와 새로운 벤치마크 'MACE-THOR'를 제안합니다.

Haishan Zeng, Mengna Wang, Peng Li

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🤖 EmboTeam: 로봇 팀을 위한 '명령형 지휘자'와 '현실 감각'의 만남

이 논문은 **"여러 종류의 로봇들이 서로 협력해서 복잡한 집안일 (예: 샌드위치 만들기) 을 어떻게 하면 잘 해낼 수 있을까?"**라는 질문에 대한 해답을 제시합니다.

기존의 로봇들은 지시사항을 들으면 "그냥 순서대로 하나씩"만 하거나, 상황이 바뀌면 당황해서 멈춰버리는 경우가 많았습니다. 이 논문은 이를 해결하기 위해 **EmboTeam(엠보팀)**이라는 새로운 시스템을 제안합니다.

이 시스템을 이해하기 쉽게 3 단계의 드라마비유로 설명해 드릴게요.


🎬 1. 배경: 왜 로봇 팀은 실패할까?

상상해 보세요. 주방에 로봇 A(칼질 전문), 로봇 B(운반 전문), **로봇 C(냉장고 관리 전문)**가 있습니다. 사람이 "샌드위치 재료를 준비해서 냉장고에 넣어줘"라고 말합니다.

  • 기존 방식의 문제점:
    • 로봇 A가 토마토를 다듬는 동안 로봇 B는 "내가 뭘 해야 하지?"라며 멍하니 서 있거나, 재료를 잘못 가져가서 낭비합니다.
    • 로봇 A가 칼을 놓는 순간, 로봇 B가 그 칼을 집으려다 충돌합니다.
    • 핵심: 로봇들이 서로의 상황을 모르고, "지금 내가 무엇을 해야 할지" 실시간으로 판단하지 못하기 때문입니다.

🚀 2. EmboTeam 의 해결책: 3 단계 협업 시스템

EmboTeam 은 세 가지 역할을 가진 전문가들이 팀을 이루어 문제를 해결합니다.

🧠 1 단계: "명령 해석자" (LLM - 큰 언어 모델)

  • 역할: 사람의 복잡한 말 ("샌드위치 재료 준비해") 을 로봇들이 이해할 수 있는 정확한 작업 지시서로 바꿉니다.
  • 비유: 마치 건축 설계사가 "집을 지어줘"라는 말만 듣고, "A 는 벽돌을 쌓고, B 는 창문을 설치하고, C 는 배관을 연결해"라고 구체적인 도면과 작업 순서를 그려내는 역할입니다.
  • 특징: 단순히 순서를 나열하는 게 아니라, "로봇 A 는 칼질만 하고, 로봇 B 는 운반만 한다"고 각 로봇의 능력에 맞춰 작업 분배를 합니다.

📝 2 단계: "논리적 계획가" (PDDL - 형식적 계획 언어)

  • 역할: 설계사가 그린 도면을 바탕으로 최적의 실행 계획을 세우고, 모순이 없는지 검증합니다.
  • 비유: 현장 감독이 "A 가 벽돌을 쌓기 전에 B 가 시멘트를 준비해야 해"라고 논리적 제약을 정하고, "A 와 B 가 동시에 움직여도 충돌하지 않게" 경로를 계산합니다.
  • 핵심: 로봇들이 서로의 작업을 기다려야 할 때 (예: "토마토가 다듬어지면 운반해라") 이를 명확하게 정의하여 **동시 작업 (병렬 처리)**이 가능하게 만듭니다.

🛡️ 3 단계: "현실 감각형 지휘자" (Behavior Tree - 행동 트리)

  • 역할: 계획된 대로 움직이지만, 예상치 못한 사고가 나면 즉시 대응합니다.
  • 비유: 현장 지휘관이 "계획대로 가자"고 하지만, 갑자기 토마토가 바닥에 떨어지거나 다른 로봇이 길을 막으면, "계획을 멈추고, 토마토를 줍거나, 우회해서 가라"고 즉시 지시를 바꿉니다.
  • 핵심: 로봇이 "계획대로 안 되면 실패"가 아니라, **"문제를 해결하고 다시 시도"**하는 반응형 (Reactive) 능력을 갖게 합니다.

📢 3. 비밀 무기: "공유 블랙보드" (Shared Blackboard)

이 시스템의 가장 멋진 점은 로봇들이 서로 대화를 나누는 방식입니다.

  • 기존 방식: 로봇 A 가 로봇 B 에게 직접 "나 토마토 다듬었어!"라고 말해야 함 (지연 발생, 통신 오류).
  • EmboTeam 방식: 모든 로봇이 **공유된 전광판 (블랙보드)**을 봅니다.
    • 로봇 A 가 토마토를 다듬으면 전광판에 **"토마토 준비 완료 ✅"**라고 적힙니다.
    • 로봇 B 는 전광판을 보다가 "아, 준비됐구나!"라고 알아차리고 즉시 운반을 시작합니다.
    • 효과: 로봇들이 서로를 기다리지 않고, 상황이 바뀌는 순간 즉시 반응하여 팀워크가 완벽해집니다.

🏆 4. 결과: 얼마나 잘할까요?

이 시스템을 AI2-THOR(가상 주방 시뮬레이션) 에서 테스트한 결과:

  • 기존 방식: 100 번 시도 중 12 번만 성공. (대부분 로봇이 길을 잃거나, 순서를 혼동함)
  • EmboTeam: 100 번 시도 중 55 번 성공! (성공률이 4 배 이상 향상)
  • 목표 달성률: 로봇이 해야 할 일을 얼마나 잊지 않고 했는지도 32% 에서 **72%**로 크게 올랐습니다.

💡 요약: EmboTeam 이란 무엇인가?

EmboTeam 은 "사람의 말을 잘 이해하는 AI(설계사)" + "논리적으로 계획을 세우는 수학자(감독)" + **"실제 상황에 유연하게 대응하는 현장 지휘관(지휘자)"**이 하나로 합쳐진 시스템입니다.

이들은 서로의 역할을 나누고, 공유 전광판을 통해 실시간으로 소통함으로써, 여러 종류의 로봇들이 마치 한 팀의 프로 스포츠 선수들처럼 복잡한 집안일을 척척 해내게 합니다.

이 기술은 앞으로 재해 구조, 물류 창고, 혹은 우리 집안에서 여러 로봇이 함께 일하는 미래를 가능하게 할 것입니다! 🤖✨