InfinityStory: Unlimited Video Generation with World Consistency and Character-Aware Shot Transitions

이 논문은 배경 일관성 유지, 다중 등장인물이 포함된 장면 전환의 매끄러움, 그리고 시간적 연속성을 보장하여 장편 스토리텔링 비디오 생성의 한계를 극복하는 새로운 프레임워크, 데이터셋, 그리고 모델을 제안합니다.

Mohamed Elmoghany, Liangbing Zhao, Xiaoqian Shen, Subhojyoti Mukherjee, Yang Zhou, Gang Wu, Viet Dac Lai, Seunghyun Yoon, Ryan Rossi, Abdullah Rashwan, Puneet Mathur, Varun Manjunatha, Daksh Dangi, Chien Nguyen, Nedim Lipka, Trung Bui, Krishna Kumar Singh, Ruiyi Zhang, Xiaolei Huang, Jaemin Cho, Yu Wang, Namyong Park, Zhengzhong Tu, Hongjie Chen, Hoda Eldardiry, Nesreen Ahmed, Thien Nguyen, Dinesh Manocha, Mohamed Elhoseiny, Franck Dernoncourt

게시일 2026-03-05
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

무한 스토리 (InfinityStory): 영화 같은 긴 이야기를 자동으로 만들어주는 마법

이 논문은 **"긴 이야기를 영상으로 만들 때, 배경이 자꾸 바뀌거나 캐릭터가 갑자기 사라졌다 나타나는 문제를 해결한 새로운 기술"**을 소개합니다.

기존의 AI 영상 생성 기술은 짧은 클립 (4~16 초) 을 만드는 데는 훌륭했지만, 이를 이어 붙여 1 시간짜리 영화를 만들려고 하면 배경이 흔들리거나, 등장인물이 문득 사라졌다가 다른 장면에서 갑자기 튀어나오는 어색한 문제가 있었습니다.

이 문제를 해결하기 위해 연구진들은 **'인피니티 스토리 (InfinityStory)'**라는 새로운 시스템을 개발했습니다. 이를 이해하기 쉽게 세 가지 핵심 아이디어로 나누어 설명해 드릴게요.


1. 배경은 '고정된 무대', 캐릭터는 '배우' (배경 일관성)

🎭 비유: 무대 세트와 배우
기존 기술은 매번 새로운 장면을 찍을 때마다 무대 (배경) 를 새로 짓고, 배우 (캐릭터) 를 그 위에 올려놓는 방식이었습니다. 그래서 장면을 이어붙이면 무대 색상이나 조명 미묘하게 달라져서 "어? 이 장면 어디서 찍은 거지?" 하는 느낌이 들었습니다.

✨ 인피니티 스토리의 해결책:
이 시스템은 **"한 편의 영화는 정해진 세트장 (장소) 에서 찍는다"**는 원칙을 세웠습니다.

  • 세트장 고정: 이야기 속 '성', '숲', '카페' 같은 장소는 미리 하나하나 정해두고, 그 장면이 나오는 동안은 그 세트장이 절대 변하지 않게 합니다.
  • 배우만 교체: 배경은 그대로 두고, 그 위에 배우 (캐릭터) 만 들어오게 합니다.
  • 결과: 장면을 수십 번 이어붙여도 배경은 똑같은 곳에서 찍은 것처럼 자연스럽게 유지됩니다.

2. 캐릭터의 '자연스러운 출입구' (화면 전환 기술)

🚪 비유: 무대 앞뒤로 오가는 배우
기존 기술은 장면을 바꿀 때 (컷 전환), 캐릭터가 화면에서 뚝 끊기듯 사라지거나 갑자기 뚝 떨어지듯 나타나는 경우가 많았습니다. 마치 연극에서 배우가 무대 뒤로 도망치듯 사라졌다가, 다음 장면에서 갑자기 무대 중앙에 나타나는 것과 같습니다.

✨ 인피니티 스토리의 해결책:
이 시스템은 **10,000 개의 특수한 '연기 훈련 데이터'**를 만들어냈습니다.

  • 연기 훈련: 배우가 무대 가장자리에서 천천히 걸어 들어오거나 (Entry), 무대 밖으로 걸어 나가는 (Exit), 혹은 다른 배우와 자리를 바꾸는 (Replacement) 모습을 AI 에게 가르쳤습니다.
  • 매끄러운 연결: 두 장면을 이어줄 때, AI 가 "아, 이 배우는 왼쪽에서 걸어 들어와야지"라고 계산하여, 캐릭터가 자연스럽게 화면 안으로 들어오거나 나가는 **영화 같은 전환 (Shot-to-Shot Transition)**을 만들어냅니다.

3. '스마트 감독' 팀 (다중 에이전트 시스템)

🎬 비유: 영화 제작팀
이 기술은 혼자서 모든 일을 하는 것이 아니라, AI 로 구성된 **'영화 제작 팀'**이 협력합니다.

  • 시나리오 작가 (Chapter Agent): 이야기를 큰 줄기로 나눕니다.
  • 세트 디자이너 (Location Agent): "이 장면은 성에서, 저 장면은 숲에서"라고 장소를 미리 정해줍니다.
  • 연출가 (Scene Agent): 어떤 배우가 어떤 표정으로 서 있을지, 카메라는 어떻게 움직일지 설계합니다.
  • 촬영 감독 (Shot Agent): 실제 영상을 찍는 작업을 지시합니다.

이 팀이 서로 대화하며 "배경은 이걸로 고정하고, 다음 장면으로 넘어갈 때는 A 배우가 걸어 나오게 해라"라고 정밀하게 지시하기 때문에, 긴 이야기라도 흐트러짐 없이 만들어집니다.


🏆 왜 이 기술이 특별한가요?

기존의 다른 기술들은 배경이 자꾸 변하거나 (Drift), 캐릭터가 갑자기 사라지는 문제가 있었습니다. 하지만 인피니티 스토리는 다음과 같은 성과를 거두었습니다.

  1. 배경이 가장 안정적: 같은 장소에서 찍은 것처럼 배경이 흔들리지 않습니다.
  2. 캐릭터가 가장 일관적: 같은 캐릭터가 여러 장면에 나와도 얼굴과 옷이 똑같습니다.
  3. 전환이 가장 매끄럽습니다: 캐릭터가 화면을 오가며 자연스럽게 이어집니다.

🚀 결론

이 기술은 "AI 가 1 시간짜리 영화를 만들 때, 마치 실제 영화 제작팀이 세트장을 고정하고 배우들의 움직임을 정교하게 연기하듯" 영상을 만들어냅니다.

앞으로 이 기술은 교육용 영상, 웹툰을 애니메이션으로 바꾸는 것, 혹은 개인이 상상하는 이야기를 영화처럼 만들어주는 등 다양한 분야에서 **'진짜 같은 긴 영상'**을 만드는 데 큰 역할을 할 것으로 기대됩니다.