CamDirector: Towards Long-Term Coherent Video Trajectory Editing

CamDirector 는 하이브리드 워핑 방식과 히스토리 기반 자기회귀 확산 모델을 통해 장기간의 시간적 일관성을 유지하면서 사용자 정의 카메라 경로를 정밀하게 반영하는 새로운 비디오 궤적 편집 프레임워크를 제안하고, 이를 검증하기 위한 새로운 벤치마크인 iPhone-PTZ 를 소개합니다.

Zhihao Shi, Kejia Yin, Weilin Wan, Yuhongze Zhou, Yuanhao Yu, Xinxin Zuo, Qiang Sun, Juwei Lu

게시일 2026-03-04
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎥 '캠디렉터 (CamDirector)': 당신의 평범한 영상을 영화처럼 바꿔주는 마법사

이 논문은 **'캠디렉터 (CamDirector)'**라는 새로운 기술을 소개합니다. 쉽게 말해, 일반인이 찍은 흔들리는 영상을, 전문가가 찍은 것처럼 카메라가 부드럽게 움직이는 멋진 영화 장면으로 바꿔주는 기술입니다.

기존 기술들은 이 작업을 할 때 두 가지 큰 문제를 겪었습니다.

  1. 카메라 제어가 서툴다: "여기서 저기로 이동해!"라고 명령해도 카메라가 제멋대로 움직이거나 원하는 대로 따라가지 못했습니다.
  2. 긴 영상을 만들면 망가진다: 영상이 길어질수록 장면이 끊기거나, 물체가 갑자기 변하거나 (깜빡임), 배경이 어색하게 뭉개지는 현상이 발생했습니다.

캠디렉터는 이 두 가지 문제를 해결하기 위해 두 가지 똑똑한 비법을 사용했습니다.


🔑 비법 1: "전체 영상을 한눈에 보는 '세계 지도' (Hybrid Warping)"

기존 기술들은 영상을 만들 때 한 장의 사진 (프레임) 만 보고 다음 장을 그리는 방식을 썼습니다. 마치 눈을 감고 그림을 그리는 것과 비슷해서, 앞뒤 장면을 연결할 때 실수가 많았습니다.

캠디렉터는 반대로 영상 전체를 '세계 지도 (World Cache)'라는 거대한 지도로 먼저 만들어버립니다.

  • 정적인 배경 (벽, 나무, 건물): 이 부분은 움직이지 않으므로, 영상 전체에서 필요한 부분만 모아서 **'세계 지도'**에 깔끔하게 저장해 둡니다.
  • 동적인 물체 (사람, 차): 이 부분은 움직이므로, 원래 영상에서 그대로 잘라내어 새로운 위치로 옮깁니다.

이제 카메라를 움직일 때, 이 '세계 지도'를 보며 배경을 그리고, 움직이는 물체를 붙여넣습니다. 마치 건축가가 전체 설계도 (지도) 를 보고 벽돌을 쌓는 것처럼, 처음부터 끝까지 배경이 어긋나지 않고 완벽하게 맞춰집니다.

💡 비유:
기존 기술은 한 장의 퍼즐 조각만 보고 다음 조각을 맞추려다 보니, 전체 그림이 뒤틀리는 일이 많았습니다.
캠디렉터는 퍼즐 전체의 완성된 그림 (세계 지도) 을 먼저 보고, 그 위에 움직이는 조각들만 정확히 끼워 넣습니다. 그래서 그림이 일그러지지 않습니다.


🔑 비법 2: "과거를 기억하며 이어가는 '연속극 작가' (History-Guided Autoregressive)"

영상이 길어지면, 앞부분과 뒷부분이 서로 다른 스타일로 변해버릴 수 있습니다. 예를 들어, 1 분짜리 영상에서 주인공 옷 색깔이 10 분 뒤에는 달라지는 식이죠.

캠디렉터는 연속극 작가처럼 작동합니다.

  • 과거를 기억합니다: 지금 장면을 그릴 때, **이전에 그린 장면 (역사)**을 계속 참고합니다. "아까 주인공이 파란 옷을 입었으니, 지금도 파란 옷을 입혀야지!"라고 생각하며 다음 장면을 그립니다.
  • 지도를 업데이트합니다: 새로 그린 장면에서 배경이 더 선명해지면, 그 정보를 다시 **'세계 지도'**에 추가합니다. 그래서 다음 장면을 그릴 때 더 정확한 정보를 바탕으로 그릴 수 있습니다.

이 과정을 반복하면, 영상이 끝날 때까지 장면이 자연스럽게 이어지고, 물체나 배경이 갑자기 변하지 않습니다.

💡 비유:
기존 기술은 각 에피소드를 다른 작가가 따로따로 썼다가, 마지막에 편집해서 붙이는 방식이라 결이 달랐습니다.
캠디렉터는 한 명의 작가이전 에피소드를 계속 기억하며 다음 에피소드를 써내려갑니다. 그래서 스토리와 분위기가 끝까지 일관됩니다.


📱 새로운 시험장: '아이폰-PTZ' 데이터셋

이 연구팀은 기존에 쓰던 데이터셋이 너무 단순해서 (카메라가 거의 안 움직이거나, 장면이 단순함) 새로운 테스트용 데이터셋 **'아이폰-PTZ'**를 만들었습니다.

  • 일반인이 손으로 들고 찍은 영상 (흔들림 있음) 을 입력으로 받습니다.
  • 전문 촬영 장비 (PTZ) 로 찍은 것처럼 회전, 이동, 줌인/줌아웃 등 다양한 카메라 움직임을 요구합니다.
  • 이 새로운 시험에서 캠디렉터는 **기존 최고 기술들보다 훨씬 적은 컴퓨터 자원 (파라미터)**으로 더 좋은 결과를 냈습니다.

🌟 결론: 왜 이 기술이 중요한가요?

캠디렉터는 **평범한 일상 영상을 영화 같은 장면으로 바꿔주는 '마법 지팡이'**입니다.

  1. 정확한 카메라 제어: 원하는 대로 카메라를 움직여도 장면이 깨지지 않습니다.
  2. 긴 영상도 완벽: 10 분, 20 분 영상을 만들어도 처음과 끝이 자연스럽게 연결됩니다.
  3. 효율성: 무거운 컴퓨터 없이도 (적은 파라미터로) 고품질 영상을 만들 수 있습니다.

이제 누구나 스마트폰으로 찍은 평범한 영상도, 마치 할리우드 영화처럼 카메라가 유유히 움직이는 멋진 영상으로 만들 수 있는 시대가 왔습니다! 🎬✨