"When to Hand Off, When to Work Together": Expanding Human-Agent Co-Creative Collaboration through Concurrent Interaction

이 논문은 공유 작업물에서의 동시 상호작용을 실시간으로 해석하고 적응하는 새로운 에이전트 시스템 'CLEO'를 제안하고, 두 차례의 연구를 통해 인간과 에이전트가 언제 위임, 지시, 동시 작업을 선택하는지에 대한 결정 모델과 디자인 시사점을 제시합니다.

Kihoon Son, Hyewon Lee, DaEun Choi, Yoonsu Kim, Tae Soo Kim, Yoonjoo Lee, John Joon Young Chung, HyunJoon Jung, Juho Kim

게시일 Mon, 09 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"인간과 AI 가 함께 일할 때, 언제 AI 에게 맡기고 언제 직접 손에 잡아야 할까?"**라는 아주 실용적인 질문에서 시작합니다.

기존의 AI 는 우리가 "이거 만들어줘"라고 하면, AI 가 혼자서 열심히 일하다가 "네, 완성했습니다!"라고 결과물만 가져오는 수동적인 비서 역할을 했습니다. 하지만 이 연구는 AI 를 함께 일하는 파트너로 바꾸고 싶어 합니다.

이 내용을 쉽게 이해할 수 있도록 **요리사 (AI) 와 셰프 (사용자)**의 비유를 들어 설명해 드릴게요.


1. 문제: "눈이 가려진 요리사"

과거의 AI(요리사) 는 부엌 안의 커튼을 치고 혼자 요리를 했습니다. 우리는 "스테이크 구워줘"라고 말하고 기다리기만 했죠.

  • 문제점: 요리사가 소금과 너무 많이 넣었나? 아니면 불을 너무 세게 했나? 우리는 알 수 없었습니다. 다 구워진 후에 "아, 너무 짜네!"라고 말하면 이미 늦은 거죠.
  • 연구 1 의 발견: 연구진은 커튼을 치지 않고 요리사가 재료를 다듬고, 팬을 흔드는 모든 과정을 실시간으로 보여주는 시스템을 만들었습니다. 그랬더니 사람들은 "아, 지금 소금을 넣는구나. 내가 좀 더 넣어야겠다"라고 중간에 개입하고 싶어 했습니다. 하지만 기존 시스템은 사용자의 손을 막거나, 사용자의 행동을 무시하고 계속 일해서 혼란이 생겼습니다.

2. 해결책: "Cleo(클리오)" - 눈이 있고 귀가 있는 요리사

연구진은 Cleo라는 새로운 AI 에이전트를 개발했습니다. Cleo 는 요리사가 요리를 하는 동안, 사용자가 옆에서 재료를 고치거나 레시피를 수정해도 그걸 알아듣고 적응할 수 있습니다.

  • 예시: 요리사가 "스테이크에 허브를 뿌리는 중"일 때, 사용자가 "아니야, 로즈마리 말고 바질을 써!"라고 직접 재료를 바꾸면, Cleo 는 "아, 사용자가 바질을 원했구나!"라고 바로 알아차리고 다음 단계부터 바질을 사용합니다.

3. 핵심 발견: "5 가지 협업 모드"

10 명의 전문 디자이너와 2 일간 실험을 한 결과, 사람들은 상황에 따라 5 가지 방식으로 AI 와 일하는 것을 발견했습니다.

  1. 완전 위임 (Hands-off): "너가 알아서 다 해줘. 나는 다른 일 할게." (AI 가 일하는 동안 사용자는 완전히 딴짓)
  2. 관찰 (Observational): "어떻게 하는지 보여줘. 내가 배울게." (AI 가 일하는 것을 구경하며 학습)
  3. 지시 (Directive): "이건 좀 바꿔줘." (말만 하고 직접 건드리지는 않음)
  4. 동시 작업 (Concurrent): "함께 해!" (AI 가 요리를 하는 동안, 사용자가 옆에서 그릇을 닦거나 소스를 준비함. 가장 중요한 발견)
  5. 중단 (Terminating): "안 돼, 이거 다 지워!" (AI 가 잘못된 방향으로 가면 바로 멈춤)

흥미로운 점: 사람들은 30% 이상의 시간 동안 AI 가 일하는 동안 직접 손을 대며 함께 일했습니다. AI 가 요리를 하는 동안 사용자가 옆에서 재료를 다듬는 것처럼 말이죠.

4. 언제 무엇을 해야 할까? (의사결정 모델)

사람들은 언제 AI 에게 맡기고 언제 직접 할지 어떻게 정할까요? 연구진은 이를 결정하는 **6 가지 신호 (트리거)**와 4 가지 조건을 찾아냈습니다.

  • 신호 (왜 개입했나?):
    • 아이디어 번뜩임: AI 가 만드는 걸 보다가 "와, 이거 좋은데! 나도 이걸로 해보자!"라고 생각함.
    • 오해 발견: "아, 내가 말한 게 저게 아니었어!"라고 realizing.
    • 새로운 작업: "이거 다 끝나면 저기 다른 거 해줘."
  • 조건 (어떻게 개입할까?):
    • 내 작업의 중요도: 내가 지금 바쁘면 AI 에게 맡기고, 여유가 있으면 같이 함.
    • AI 에 대한 믿음: "이 AI 는 내 말 잘 알아듣겠지?"라고 생각하면 말로 지시하고, "아니, 내가 직접 손으로 고치는 게 낫겠다"라고 생각하면 직접 만듦.

5. 결론: "함께 춤추는 파트너"

이 연구는 AI 를 단순히 "명령을 실행하는 기계"가 아니라, 사용자의 행동을 보고 실시간으로 반응하는 파트너로 바꿔야 한다고 말합니다.

  • 비유: 과거의 AI 는 "명령을 받고 혼자 춤추는 로봇"이었다면, Cleo 같은 새로운 AI 는 **"사용자가 리듬을 바꾸면 같이 리듬을 바꾸는 춤 파트너"**입니다.
  • 미래의 디자인: 앞으로의 AI 는 사용자가 옆에서 손을 대면 멈추거나, 사용자의 시선이 어디에 집중되는지 보고 "아, 사용자가 지금 개입하고 싶어 하는구나"라고 미리 알아차려야 합니다.

한 줄 요약:

"AI 에게 일을 맡길지, 함께 할지, 아니면 멈출지는 상황과 신뢰에 따라 결정되는데, 가장 좋은 협업은 AI 가 일하는 동안 사용자가 옆에서 함께 손을 대며 실시간으로 방향을 잡는 것입니다."

이 연구는 우리가 AI 와 함께 창의적인 일을 할 때, 대화를 나누듯 실시간으로 소통하고 함께 작업하는 새로운 방식을 제시합니다.