SARAH: Spatially Aware Real-time Agentic Humans

이 논문은 VR 및 디지털 인간 애플리케이션을 위해 사용자의 위치와 대화 음성을 실시간으로 분석하여 자연스러운 시선과 제스처를 포함한 공간 인식형 대화 에이전트 운동을 생성하는 'SARAH'라는 새로운 실시간 인과적 방법을 제안합니다.

Evonne Ng, Siwei Zhang, Zhang Chen, Michael Zollhoefer, Alexander Richard

게시일 2026-02-23
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"SARAH"**이라는 이름의 새로운 기술을 소개합니다. 쉽게 말해, 가상 현실 (VR) 속의 인공지능 친구가 사용자의 움직임에 맞춰 자연스럽게 반응하며 대화하는 방법을 개발한 것입니다.

기존의 가상 인형들은 사용자가 주변을 돌아다니면 그 자리에서 멍하니 앞만 보고 있거나, 사용자를 따라다니는 게 아니라 오히려 멀어지는 등 어색한 행동을 했습니다. 이 논문은 그 문제를 해결했습니다.

이 기술을 쉽게 이해할 수 있도록 세 가지 핵심 비유로 설명해 드릴게요.


1. "눈을 맞추는 대화상대" (공간적 인식)

기존의 가상 친구들은 마치 무대 위에서 고정된 조명 아래 서 있는 배우처럼, 사용자가 무대 앞을 왔다 갔다 해도 시선을 주지 않았습니다.

하지만 SARAH 는 실제 카페에서 친구와 대화하는 사람처럼 행동합니다.

  • 당신이 왼쪽으로 걸어가면, SARAH 는 고개를 돌려 당신을 바라봅니다.
  • 당신이 다가오면, SARAH 는 자연스럽게 몸을 살짝 비틀며 대화에 집중합니다.
  • 마치 눈을 맞추고 대화하는 사람처럼, 당신의 위치를 실시간으로 파악하고 반응합니다.

2. "미래를 알지 못하는 마법사" (실시간 처리)

대부분의 최신 AI 는 영화를 만들 때처럼 미래의 장면을 미리 보고 (비 causal) 움직임을 설계합니다. 하지만 VR 에서 대화할 때는 미래를 알 수 없습니다. 오직 '지금'과 '과거'만 있을 뿐이죠.

기존 기술들은 미래를 미리 보기 때문에 느리고, 실시간으로 대화할 때 끊김이 생겼습니다.
SARAH 는 즉흥 연극을 하는 마법사와 같습니다.

  • 내일 무슨 일이 일어날지 모르지만, 지금 당신이 하는 말과 움직임을 듣고 즉시 반응합니다.
  • 미래를 미리 볼 필요 없이, 순간순간의 흐름에 맞춰 300 초 (초당 300 프레임) 라는 매우 빠른 속도로 자연스럽게 움직입니다. 이는 기존 기술보다 3 배나 빠릅니다.

3. "눈맞춤 조절기" (사용자 맞춤 제어)

사람마다 눈맞춤을 하는 것을 좋아하는 정도가 다릅니다. 어떤 사람은 눈을 마주치는 것을 좋아하고, 어떤 사람은 조금 피하는 것을 선호하죠.

기존 기술은 AI 가 "어떻게 눈을 맞추는지"를 학습한 대로만 고정되어 있었습니다. 하지만 SARAH 는 사용자가 직접 눈맞춤 강도를 조절할 수 있는 리모컨을 제공합니다.

  • **"눈을 더 마주쳐!"**라고 설정하면 AI 는 당신을 빤히 쳐다봅니다.
  • **"조금 더 자연스럽게 피하게 해줘"**라고 설정하면, AI 는 대화하듯 시선을 왔다 갔다 합니다.
  • AI 는 자연스러운 눈맞춤 패턴을 먼저 학습해 두었다가, 사용자가 원하는 대로 조절해 주는 것입니다.

💡 요약: 왜 이것이 중요한가요?

이 기술은 가상 현실 (VR) 에서 인공지능 친구가 진짜 사람처럼 느껴지게 만드는 핵심 열쇠입니다.

  • 이전: 가상 친구가 당신을 보지 않고 앞만 응시하거나, 당신이 움직일 때 어색하게 제자리에 멈춰 있습니다.
  • 이제 (SARAH): 당신이 돌아서면 친구도 고개를 돌리고, 당신이 말을 하면 손짓을 하며, 당신의 눈높이에 맞춰 자연스럽게 반응합니다.

이 연구는 Meta Reality Labs에서 개발되었으며, 앞으로 VR 게임, 원격 회의, 디지털 인간 서비스 등에서 더욱 생생하고 자연스러운 소통을 가능하게 할 것으로 기대됩니다. 마치 진짜 친구와 대화하듯, 공간감을 느끼며 실시간으로 반응하는 AI 시대가 열린 것입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →