BoxSplitGen: A Generative Model for 3D Part Bounding Boxes in Varying Granularity

이 논문은 인간의 창의적 사고 과정을 모방하여 거친 바운딩 박스를 반복적으로 분할하여 3D 부분 박스를 생성하는 'BoxSplitGen' 모델과 이를 3D 형상으로 변환하는 모델을 제안하여, 기존 생성 모델보다 직관적이고 상호작용적인 3D 형태 생성 및 세부화 성능을 입증합니다.

Juil Koo, Wei-Tung Lin, Chanho Park, Chanhyeok Park, Minhyuk Sung

게시일 2026-02-25
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎨 1. 핵심 아이디어: "레고 블록으로 상상하기"

기존의 3D 생성 AI 는 "강아지 그림을 그려줘"라고 말하면 강아지 한 마리를 뚝딱 만들어냈습니다. 하지만 사용자가 "강아지 귀는 좀 더 크게 해줘"라고 수정하거나, "강아지 대신 고양이로 바꿔줘"라고 세부적으로 조정하려면 매우 어려웠습니다.

BOXSPLITGEN은 이 문제를 해결하기 위해 레고 블록을 사용하는 방식을 택했습니다.

  • 초반 (거친 단계): 처음에는 거대한 레고 블록 하나만 있습니다. 이것이 "강아지" 전체를 의미하는 거대한 상자 (Bounding Box) 입니다.
  • 중반 (나누기): 사용자가 "이 블록을 잘라서 다리와 몸통을 따로 만들어줘"라고 하면, AI 는 그 큰 블록을 두 개의 작은 블록으로 쪼개줍니다.
  • 후반 (세부화): 이 과정을 반복하면, 거대한 상자 하나가 점점 작고 정교한 상자들로 나뉘어집니다. 결국 이 작은 상자들이 모여 강아지의 머리, 몸, 다리 등 구체적인 형태를 이룹니다.

이처럼 상자를 쪼개고 (Splitting), 그 상자를 바탕으로 실제 3D 모양을 만들어내는 (Box-to-Shape) 두 가지 단계를 거쳐 사용자가 원하는 대로 3D 물체를 디자인할 수 있게 합니다.


🛠️ 2. 어떻게 작동할까요? (두 명의 도우미)

이 시스템은 두 명의 전문 도우미 (AI 모델) 가 협력하여 작동합니다.

① 첫 번째 도우미: "상자 나누기 전문가" (BOXSPLITGEN)

이 도우미의 역할은 **"어떤 상자를 쪼개야 할지"**와 **"쪼개진 두 개의 새로운 상자가 어떻게 생길지"**를 결정하는 것입니다.

  • 비유: 마치 나무를 가꾸는 정원사처럼 생각해보세요.
    • ** Pivot Classifier (선택기):** 정원사는 나무의 어느 가지가 자라기 좋은지 (어떤 상자를 쪼갤지) 판단합니다.
    • Child-Boxes Diffusion (분열기): 선택된 가지를 잘라내면, 그 자리에서 두 개의 새 가지가 어떻게 뻗어 나올지 (새로운 상자의 모양) 예측합니다.
  • 특이점: 기존 AI 는 글을 쓸 때 한 글자씩 순서대로 쓰지만, 이 모델은 "상자 하나를 지우고, 그 자리에 두 개의 새 상자를 동시에 넣는" 독특한 방식을 사용합니다. 그래서 기존의 일반적인 AI 와는 다른 특별한 알고리즘을 썼습니다.

② 두 번째 도우미: "상자에서 모양 만들기 전문가" (BOX2SHAPE)

이 도우미는 쪼개진 상자들이 모여 있는 모습을 보고, "이 상자들 안에 실제 3D 물체가 어떻게 들어갈지" 채워 넣습니다.

  • 비유: 상자들이 나열된 지도를 보고, 그 지도 위에 실제 건물을 짓는 건축가입니다.
  • 기술: 이미 잘 훈련된 고도의 3D 생성 AI(3DShape2VecSet) 를 베이스로 사용하되, 사용자가 지정한 상자 (조건) 에 맞춰 모양을 변형할 수 있도록 'ControlNet'이라는 기술을 적용했습니다.
  • 결과: 사용자가 "이쪽 상자는 넓게, 저쪽 상자는 길게"라고 조정하면, AI 는 그 지시에 맞춰 3D 물체의 형태를 자연스럽게 변형시킵니다.

🌟 3. 왜 이것이 특별한가요?

기존의 3D 생성 기술은 "한 번에 뚝딱" 만들어내는 데는 강했지만, 사용자가 직접 수정하고 디테일을 조절하는 데는 약했습니다.

  • 기존 방식: "강아지 그려줘" → 강아지 생성. (수정하려면 처음부터 다시 그려야 함)
  • 이 방식 (BOXSPLITGEN):
    1. 큰 상자 하나를 보여줍니다.
    2. "이걸 두 개로 나눠줘" → 상자가 쪼개집니다.
    3. "왼쪽 상자는 더 크게, 오른쪽은 작게" → 상자의 크기를 조절합니다.
    4. "이제 실제 모양으로 바꿔줘" → 3D 강아지가 생성됩니다.

사용자는 거친 스케치 (큰 상자) 에서 시작해, 점점 디테일을 추가하며 (상자 쪼개기) 원하는 3D 물체를 직관적으로 만들 수 있습니다. 마치 손으로 점토를 빚거나 레고를 조립하듯이, 생각의 흐름대로 3D 디자인을 할 수 있는 것이 이 기술의 가장 큰 장점입니다.

🚀 요약

이 논문은 **"3D 물체를 만들 때, 거대한 상자 하나에서 시작해 하나씩 쪼개어 가며 세부적인 모양을 만들어내는 인터랙티브한 시스템"**을 제안합니다.

  • 비유: 거대한 나무 줄기에서 시작해 가지, 잎사귀까지 쪼개어가며 나무를 완성하는 과정.
  • 효과: 사용자가 복잡한 3D 디자인을 어렵게 생각하지 않고, 상자 하나를 쪼개고 조절하는 것만으로도 창의적인 3D 물체를 쉽게 만들어낼 수 있게 됩니다.

이 기술은 앞으로 3D 게임 캐릭터 제작, 제품 디자인, 건축 설계 등 다양한 분야에서 디자이너의 상상력을 현실로 빠르게 구현하는 데 큰 도움을 줄 것으로 기대됩니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →