3DGS-HPC: Distractor-free 3D Gaussian Splatting with Hybrid Patch-wise Classification

이 논문은 이동하는 객체나 그림자 같은 일회성 방해 요인을 효과적으로 제거하여 3D 가우스 스플래팅 (3DGS) 의 재구성 품질을 향상시키기 위해, 국소 공간 일관성을 활용한 패치 단위 분류 전략과 광도 및 지각적 단서를 결합한 하이브리드 분류 메트릭을 도입한 '3DGS-HPC' 프레임워크를 제안합니다.

Jiahao Chen, Yipeng Qin, Ganlong Zhao, Xin Li, Wenping Wang, Guanbin Li

게시일 2026-03-10
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎨 1. 문제 상황: "사진 속의 방해꾼들"

상상해 보세요. 여러분이 아름다운 산과 바다를 배경으로 멋진 3D 모델을 만들려고 합니다. 하지만 찍은 사진들에는 걸어 다니는 사람, 지나가는 차, 혹은 구름 그림자 같은 것들이 섞여 있습니다.

기존의 3DGS 기술은 이 모든 것을 '진짜 배경'이라고 믿고 학습합니다. 그 결과, 3D 모델을 만들어 보면 산 위에 사람이 떠다니거나, 바닥에 그림자가 영구적으로 박히는 기괴한 오류가 생깁니다.

  • 기존 방법의 한계: 이전 연구자들은 "AI 가 사람이나 차를 알아보는 기능 (시각 모델)"을 이용해 방해꾼을 찾아냈습니다. 하지만 이 방법은 너무 엄격하거나 너무 느슨했습니다.
    • 예시: "그림자는 사람과 같은 색이니까 사람으로 분류해 버린다"거나, "산과 바위가 비슷하게 생겼으니 바위도 방해꾼으로 오해한다"는 식입니다. 마치 모든 검은색 물체를 '검은 고양이'로만 인식하는 AI처럼, 상황에 따라 엉뚱한 것을 지워버리거나 진짜 방해꾼을 놓치는 문제가 있었습니다.

💡 2. 해결책: "조각난 퍼즐과 두 가지 눈"

저자들은 이 문제를 해결하기 위해 **HPC(Hybrid Patch-wise Classification)**라는 새로운 방식을 제안했습니다. 두 가지 핵심 아이디어로 이루어져 있습니다.

🧩 아이디어 1: "픽셀 하나하나가 아니라 '조각'으로 보기" (Patch-wise Classification)

기존 방식은 사진의 픽셀 하나하나를 따로따로 판단했습니다. 이는 마치 미세한 모래알 하나하나를 손으로 하나씩 세어 분류하는 것과 같아서, 작은 실수 하나가 전체를 망칠 수 있었습니다.

  • 새로운 방식: 사진을 **작은 정사각형 조각 (Patch)**으로 나눕니다. 그리고 그 조각 전체를 하나의 덩어리로 봅니다.
  • 비유: 모래알을 하나하나 세는 대신, 레고 블록 단위로 분류하는 것입니다. "이 블록 안에는 사람 발이 있네? 그럼 이 블록 전체를 '방해꾼' 구역으로 치자!"라고 판단합니다. 이렇게 하면 주변 환경 (배경) 과의 관계를 더 잘 이해하게 되어, 실수할 확률이 훨씬 줄어듭니다.

👁️ 아이디어 2: "색깔 눈과 의미 눈의 합작" (Hybrid Classification Metric)

방해꾼을 찾을 때 두 가지 눈을 동시에 사용합니다.

  1. 색깔 눈 (Photometric): "이곳의 색이 원래 사진과 다른가?" (예: 사람 옷이 배경과 확실히 다름)
  2. 의미 눈 (Perceptual): "이곳의 형태나 질감이 원래 사진과 다른가?" (예: 사람의 윤곽이 보임)
  • 기존의 문제: '의미 눈'만 쓰면, 매끄러운 벽이나 흰색 천처럼 질감이 없는 곳에서 AI 가 혼란을 겪어 "여기에 뭔가 이상한 게 있나?"라고 오해하는 경우가 많았습니다.
  • 새로운 방식: 두 눈을 서로 보완하게 합니다.
    • 비유: 색깔 눈이 "전체적으로 방해꾼이 차지한 비율은 대략 20% 정도야"라고 대략적인 지도를 그려주면, 의미 눈이 그 지도를 바탕으로 "자, 이 20% 구역 중에서 진짜 방해꾼을 찾아내자"라고 정밀하게 작업을 합니다.
    • 이렇게 하면 흰색 벽을 실수로 지워버리는 실수를 막을 수 있습니다.

🏆 3. 결과: "깨끗하고 완벽한 3D 세계"

이 새로운 방법 (HPC) 을 적용하면 다음과 같은 변화가 일어납니다.

  • 정확한 제거: 사람, 차, 그림자 같은 방해꾼은 깔끔하게 지워집니다.
  • 배경 보호: 산, 건물, 바닥 같은 진짜 배경은 손상되지 않고 그대로 남습니다.
  • 빠른 속도: 픽셀 단위가 아니라 조각 단위로 계산하므로, 기존 방법보다 더 빠르고 효율적입니다.

📝 요약

이 논문은 **"3D 장면을 만들 때 방해꾼을 지우는 작업"**을 다음과 같이 바꿨습니다:

"하나하나의 모래알 (픽셀) 을 세느라 지치고, AI 의 오해 (시각 모델의 한계) 로 인해 진짜 배경까지 지워지는 실수를 범하는 대신, 작은 블록 (조각) 단위로 판단하고, 색깔과 의미 두 가지 정보를 서로 도와가며 방해꾼만 정확히 골라내자."

이 덕분에 우리는 사람이나 그림자가 떠다니지 않는, 더 깨끗하고 현실적인 3D 가상 세계를 훨씬 쉽고 빠르게 만들 수 있게 되었습니다.