Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems in Minecraft

이 논문은 Minecraft 와 같은 동적 환경에서 실시간 대응 능력을 향상시키기 위해, 중앙 집중식 메모리 기반의 계획 스레드와 기술 라이브러리를 활용한 행동 스레드로 구성된 병렬 계획 - 실행 프레임워크를 제안합니다.

Yaoru Li, Shunyu Liu, Tongya Zheng, Li Sun, Mingli Song

게시일 2026-03-10
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🍳 기존 방식: "생각하고 나서야 움직이는 요리사" (기존의 병렬화되지 않은 방식)

기존의 AI 시스템은 마치 매우 꼼꼼하지만 느린 요리사와 같습니다.

  1. 요리사가 "오늘 저녁 메뉴를 뭐로 할까?"라고 생각 (계획) 합니다.
  2. 메뉴를 결정하고 재료를 사러 가는 방법을 구상합니다.
  3. 그리고 나서야 비로소 손발을 움직여 재료를 자르고 요리합니다 (행동).
  4. 다음 요리를 하려면 다시 멈춰서 "다음엔 뭐지?"라고 생각해야 합니다.

문제점:

  • 시간 낭비: 생각 (계획) 하는 동안은 아무것도 하지 못합니다.
  • 유연성 부족: 요리사가 "고기 굽는 중"이라고 생각할 때, 갑자기 불이 났거나 손님이 급하게 와도 멈추고 다시 생각해야 하므로 대응이 느립니다.
  • 마인크래프트 상황: 몬스터가 갑자기 나타나도, AI 가 "공격할지 도망갈지" 생각하는 동안 이미 죽을 수 있습니다.

🚀 이 논문이 제안한 방식: "생각과 행동을 동시에 하는 '쌍둥이' 팀" (병렬화 계획 - 행동 프레임워크)

이 연구팀은 AI 에이전트에게 **두 명의 '내부 직원'**을 배치했습니다. 마치 비행기 조종사가 한 명은 비행기를 조종 (행동) 하고, 다른 한 명은 항법 장비를 보며 다음 경로를 계산 (계획) 하는 것과 같습니다.

1. 두 개의 핵심 역할 (스레드)

  • 🧠 계획 팀 (Planning Thread):

    • 역할: "지금 상황은 어때? 팀원들은 뭐라고 말하고 있어? 다음에 뭐 해야지?"를 끊임없이 고민합니다.
    • 특징: 이 팀은 중심 기억 시스템을 공유합니다. 모든 팀원의 눈과 귀를 하나로 묶어, "나 지금 피가 10% 남았어!", "저기 드래곤이 나타났다!" 같은 정보를 실시간으로 공유합니다.
    • 중단 기능: 만약 계획 팀이 "아! 지금 계획은 위험해! 멈춰!"라고 생각하면, 행동 팀에게 즉시 신호를 보냅니다.
  • 🏃 행동 팀 (Acting Thread):

    • 역할: 계획 팀이 준 지시를 받아 즉시 실행합니다. 도끼를 들고 나무를 찍거나, 몬스터와 싸우는 등 실제 작업을 합니다.
    • 특징: 이 팀은 거대한 기술 도서관을 가지고 있습니다. "다이아몬드 갑옷 만들기"라는 복잡한 지시도, "철을 캐고, 용광로에 넣고, 대장장이에게 가져가서..."라는 작은 단계들을 자동으로 쪼개서 처리해 줍니다.
    • 즉각 대응: 계획 팀이 "멈춰!" 신호를 보내면, 행동 팀은 지금 하고 있던 일을 중단하고 새로운 지시를 바로 따릅니다.

2. 왜 이것이 혁신적인가요? (비유)

  • 기존 방식: 요리사가 "소스 만들 생각"을 하는 동안, 손님이 "소스 빨리 주세요!"라고 외쳐도 들을 수 없습니다.
  • 새로운 방식: 요리사 한 명은 소스를 만들고 (행동), 다른 한 명은 "아, 소스가 부족하면 양파를 더 볶아야겠다"라고 생각 (계획) 합니다. 손님이 "소스 빨리!"라고 외치면, 생각하던 요리사가 "오케이, 지금 당장 소스 만들기 중단하고 양파 볶기 시작!"이라고 지시하고, 행동하는 요리사는 즉시 멈추고 양파를 볶습니다.

✨ 이 방식이 가져온 변화

  1. 실시간 대응: 마인크래프트에서 몬스터가 갑자기 나타나면, AI 가 "공격할까?"라고 생각하다가 행동하는 게 아니라, 공격하면서 동시에 "다음엔 약을 먹어야겠다"라고 생각할 수 있습니다.
  2. 팀워크 향상: 한 팀원이 위험에 처하면, 다른 팀원들이 그 정보를 실시간으로 공유하고 즉시 도와줍니다. (예: "나 피가 적어!" -> "내가 약 가져갈게!")
  3. 효율성: 복잡한 작업 (예: 드래곤 잡기) 을 할 때, 한 번에 모든 것을 계획할 필요 없이, 작은 단계들을 자동으로 처리하면서 큰 그림을 그려나갈 수 있어 훨씬 빠릅니다.

📊 결론

이 논문은 **"생각과 행동을 분리해서 동시에 진행하는 시스템"**을 만들어, AI 가 마인크래프트 같은 역동적인 환경에서도 인간처럼 빠르고 유연하게 움직일 수 있게 했습니다.

기존의 AI 가 "생각하는 로봇"이었다면, 이 새로운 AI 는 **"생각하면서 동시에 행동하는 현명한 팀원"**이 된 것입니다. 덕분에 복잡한 Boss(보스) 를 잡거나, 팀원들과 협력하여 어려운 미션을 수행하는 능력이 비약적으로 향상되었습니다.