IROSA: Interactive Robot Skill Adaptation using Natural Language

이 논문은 대규모 언어 모델과 모방 학습을 결합하여 7 자유도 로봇이 자연어 명령을 통해 산업용 베어링 삽입 작업의 속도와 궤적, 장애물 회피 등을 안전하고 해석 가능하게 적응하도록 하는 새로운 프레임워크 IROSA 를 제안합니다.

Markus Knauer, Samuel Bustamante, Thomas Eiband, Alin Albu-Schäffer, Freek Stulp, João Silvério

게시일 2026-03-05
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🤖 로봇을 "말"로 조종하는 마법: IROSA 소개

이 논문은 **"로봇에게 자연어로 지시를 내리면, 로봇이 그 말을 듣고 행동을 스스로 고쳐준다"**는 획기적인 기술을 소개합니다. 마치 로봇에게 "조금 더 천천히 해줘"라고 말하면 로봇이 바로 속도를 조절하고, "저기 파란 상자를 피해"라고 하면 길을 바꿔가는 것과 같습니다.

이 기술을 쉽게 이해할 수 있도록 세 가지 핵심 비유로 설명해 드릴게요.


1. 🛠️ 핵심 아이디어: "로봇은 기계공, AI 는 지시자" (IROSA 의 구조)

기존의 많은 로봇 기술은 로봇이 직접 "머리"를 써서 행동을 결정하게 만들었습니다. 하지만 이 방법은 로봇이 실수하거나, 왜 그런 행동을 했는지 알기 어렵다는 문제가 있었습니다.

이 논문은 IROSA라는 새로운 방식을 제안합니다.

  • 비유: 로봇을 숙련된 요리사라고 상상해 보세요. 요리사는 이미 "요리법 (기술)"을 잘 알고 있습니다.
  • 기존 방식: 요리사에게 "오늘 메뉴를 바꿔줘"라고 하면, 요리사가 직접 레시피를 새로 짜려고 애쓰다가 실패하거나 이상한 요리를 만들 수 있습니다.
  • IROSA 방식: 우리는 **전문 비서 (LLM, 대형 언어 모델)**를 고용합니다. 비서는 요리사에게 직접 요리를 시키지 않고, **"조리 도구 (Tool)"**만 건네줍니다.
    • 사용자가 "조금 더 천천히 볶아줘"라고 말하면, 비서는 **"속도 조절 버튼"**이라는 도구를 찾아 요리사에게 건넙니다.
    • 사용자가 "파란 상자를 피해"라고 말하면, 비서는 **"장애물 피하기 도구"**를 찾아 건넙니다.

핵심: 로봇 (요리사) 은 안전한 도구만 사용하도록 제한되어 있어, 실수할 확률이 적고 안전합니다. AI(비서) 는 로봇을 직접 조종하지 않고, 오직 검증된 도구만 선택해서 전달합니다.

2. 🧩 기술의 핵심: "자석으로 궤적을 구부리기" (KMP 와 도구)

로봇이 어떻게 말을 듣고 행동을 바꿀까요? 여기에는 **KMP(커널화된 모션 프라임)**라는 기술이 쓰입니다.

  • 비유: 로봇의 움직임은 자석으로 된 구슬이 달린 줄이라고 생각하세요.
    • 처음에 사람이 로봇을 손으로 잡고 가르쳐주면 (시연), 그 줄이 특정 모양 (예: 상자에서 물건을 꺼내서 테이블에 놓는 경로) 으로 고정됩니다.
    • 이제 사용자가 "빨리 해줘"라고 말하면, 비서는 속도 조절 도구를 써서 줄의 시간 간격을 조절합니다. (구슬이 움직이는 속도가 빨라지거나 느려집니다.)
    • 사용자가 "왼쪽으로 좀 치우쳐"라고 말하면, 비서는 경로 수정 도구를 써서 줄에 **새로운 자석 (Via-point)**을 붙입니다. 그럼 줄이 자연스럽게 그 자석 쪽으로 꺾이게 됩니다.
    • "장애물 피하기"는 반발력 도구를 써서, 장애물 근처의 줄을 밀어내어 꺾이게 만듭니다.

이 방식은 로봇이 처음부터 다시 배우는 게 아니라, 이미 배운 기술을 살짝만 수정하는 것이기 때문에 매우 빠르고 안전합니다.

3. 🏭 실제 실험: 공장에서 로봇이 말을 듣다

연구진은 실제 공장에서 7 개의 관절을 가진 로봇을 이용해 실험했습니다.

  • 상황: 로봇이 베어링(기계 부품) 을 상자에서 꺼내 측정기에 넣는 작업을 합니다.
  • 상황 1 (속도 조절): 사용자가 "상자와 측정기 사이에서 50% 느리게 움직여줘"라고 말하자, 로봇은 그 구간만 천천히 움직였습니다.
  • 상황 2 (경로 수정): 카메라가 왼쪽에 새로 생기자, "카메라로 부품을 확인해줘"라고 말하자, 로봇이 경로를 살짝 비틀어 카메라 쪽으로 갔다가 다시 원래 경로로 돌아갔습니다.
  • 상황 3 (장애물 회피): 갑자기 파란 상자가 길에 놓이자, "파란 상자를 피해줘"라고 말하자, 로봇은 상자를 우회하는 새로운 길을 스스로 찾아냈습니다.

🌟 왜 이 기술이 중요한가요?

  1. 안전함 (Safety): AI 가 로봇을 직접 조종하지 않고, 미리 검증된 '안전 도구'만 쓰게 하므로 로봇이 미친 듯이 움직이거나 다칠 위험이 없습니다.
  2. 설명 가능함 (Transparency): 로봇이 왜 그 행동을 했는지 알 수 있습니다. "비서가 '속도 조절 도구'를 선택했기 때문에 로봇이 느려진 것"이라고 명확히 추적할 수 있습니다.
  3. 재교육 불필요: 로봇에게 새로운 일을 가르치기 위해 수천 번을 반복해서 학습시킬 필요가 없습니다. 말로 지시만 하면 바로 적응합니다.

🚀 결론

이 논문은 **"로봇과 인간의 소통"**을 한 단계 업그레이드했습니다. 이제 우리는 복잡한 프로그래밍 코드를 짜지 않고, 일상적인 말로 로봇에게 "조금 더 조심해", "저기서 멈춰", "빨리 해"라고 말하면, 로봇이 그 뜻을 정확히 이해하고 안전하게 행동을 수정합니다.

이는 공장이나 병원처럼 정확함과 안전이 생명인 곳에서 로봇을 더 쉽게, 더 똑똑하게 활용할 수 있는 미래를 보여줍니다.