DreamAnywhere: Object-Centric Panoramic 3D Scene Generation

이 논문은 텍스트 기반 360 도 파노라마 이미지 생성, 객체 분해 및 3D 재구성을 통해 일관성 있고 편집 가능한 3D 장면을 신속하게 제작할 수 있는 모듈형 시스템 'DreamAnywhere'를 제안하며, 기존 방법들의 한계를 극복하고 다양한 시나리오에서 우수한 성능을 입증합니다.

Edoardo Alberto Dominici, Jozef Hladky, Floor Verhoeven, Lukas Radl, Thomas Deixelberger, Stefan Ainetter, Philipp Drescher, Stefan Hauswiesner, Arno Coomans, Giacomo Nazzaro, Konstantinos Vardis, Markus Steinberger

게시일 2026-02-18
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

드림어니웨어 (DreamAnywhere): 말 한마디로 만들어지는 3D 세상

이 논문은 **"말 한마디로 상상한 장면을 360 도 구석구석까지 탐험할 수 있는 3D 세계로 만들어주는 기술"**을 소개합니다. 기존의 기술들은 앞쪽만 보거나, 옆으로 조금만 이동해도 장면이 뭉개지거나 엉망이 되는 문제가 있었는데요. 이 연구는 그 문제를 해결했습니다.

이 기술을 쉽게 이해하기 위해 마법사의 요리레고 조립에 비유해 설명해 드릴게요.


1. 핵심 아이디어: "전체 지도를 먼저 그리고, 레고를 끼워 넣자"

기존의 3D 생성 기술은 마치 벽화를 그리는 것과 비슷했습니다. 벽화 앞에서는 예쁘지만, 벽에서 비스듬히 보면 그림이 왜곡되거나 구멍이 생깁니다.

드림어니웨어는 접근 방식을 완전히 바꿨습니다.

  1. 360 도 파노라마 사진 (전체 지도) 을 먼저 그립니다.
    • 사용자가 "모자를 쓴 큰 게가 있는 신비로운 해변"이라고 말하면, AI 가 먼저 그 해변의 360 도 전체 사진을 한 장에 그립니다. 이때 배경과 물체 (게) 를 분리해 둡니다.
  2. 물체 (레고) 를 따로 정교하게 만듭니다.
    • 분리된 '게'는 2D 그림이 아니라, 구석구석 볼 수 있는 실제 3D 레고 조각처럼 정교하게 다시 만듭니다.
  3. 다시 조립합니다.
    • 정교하게 만든 3D 레고 (게) 를 미리 그려둔 360 도 배경 지도 위에 정확히 끼워 넣습니다.

이렇게 하면 사용자가 배경을 빙글빙글 돌며 구경하거나, 게의 뒤로 가서 뒤에서 바라봐도 장면이 뚝뚝 끊기지 않고 자연스럽게 보입니다.


2. 작동 원리: 3 단계 요리 과정

이 시스템은 크게 세 가지 단계로 나뉩니다.

1 단계: 360 도 배경 지도 그리기 (Panorama Generation)

  • 비유: 요리사가 레시피 (텍스트) 를 보고 먼저 식탁 전체의 배치도를 그리는 것과 같습니다.
  • 기술적 특징: 단순히 그림을 그리는 게 아니라, 사용자가 원하는 스타일 (예: 반 고흐 풍, 애니메이션 풍) 을 정확히 따라가면서도 360 도 전체가 자연스럽게 연결되도록 훈련된 AI 를 사용합니다. 여기서 중요한 건, 배경과 물체를 미리 분리한다는 점입니다.

2 단계: 물체 (오브젝트) 의 3D 재탄생 (Object Reconstruction)

  • 비유: 분리된 '게'가 처음엔 흐릿하고 찌그러진 사진일 수 있습니다. 이걸 고화질 3D 피규어로 업그레이드하는 과정입니다.
  • 문제 해결: 파노라마 사진에서 잘라낸 물체는 옆모습이 없거나 왜곡되어 있을 수 있습니다. AI 는 이 물체의 특징 (모자, 색깔, 재질) 을 분석하고, 여러 각도에서 본 듯한 고화질 사진을 새로 그려낸 뒤, 이를 바탕으로 완벽한 3D 모델로 만듭니다.
  • 효과: 사용자가 게 뒤로 가서 뒤에서 보더라도, 게의 등이나 모자 뒷면이 자연스럽게 보입니다.

3 단계: 3D 세계 완성 및 구멍 메우기 (3D Background & Inpainting)

  • 비유: 배경 지도를 3D 공간으로 부풀리고, 물체를 뺀 자리에 보이지 않았던 뒷면의 풍경을 채워 넣는 작업입니다.
  • 기술적 특징: 물체를 뺀 자리는 원래 비어있거나 가려져 있던 부분입니다. AI 는 2D 그림을 3D 점 (Gaussian Splatting) 으로 변환하고, 가려진 부분을 상상해서 채워 넣습니다. 이때 여러 각도에서 보았을 때 모순이 없도록 3D 보정 기술을 적용합니다.

3. 왜 이 기술이 특별한가요?

  • 이동 자유도: 기존 기술은 카메라가 조금만 움직여도 장면이 깨졌지만, 이 기술은 수백 미터를 이동하거나 뒤로 돌아서 봐도 장면이 일관성 있게 유지됩니다.
  • 수정 가능성: 만약 "게를 없애고 거북이를 넣으려"면, 배경은 그대로 두고 게만 지우고 거북이 3D 모델을 끼워 넣기만 하면 됩니다. 마치 레고를 조립하고 분해하듯 쉽습니다.
  • 실용성: 영화 제작자나 게임 개발자가 비싼 3D 모델링 없이도, 아이디어를 빠르게 시각화하고 시뮬레이션할 수 있게 해줍니다.

4. 요약

드림어니웨어는 "말 한마디로 3D 세상을 만드는" 기술 중에서도 가장 탐험하기 좋고, 수정하기 쉬운 방법입니다.

  • 기존 기술: 앞쪽만 예쁜 2D 그림을 3D 로 속여 속이는 것. (옆으로 가면 뚝)
  • 드림어니웨어: 360 도 배경 지도를 먼저 그리고, 그 위에 정교한 3D 레고 조각들을 끼워 넣는 것. (어디서 봐도 자연스러움)

이 기술은 앞으로 영화, 게임, 가상 현실 (VR) 에서 우리가 상상하는 장면을 훨씬 쉽고 빠르게 만들어낼 수 있는 열쇠가 될 것입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →