Revisiting an Old Perspective Projection for Monocular 3D Morphable Models Regression

이 논문은 헤드마운트 카메라로 촬영된 근접 얼굴 영상에서 발생하는 원근 왜곡을 효과적으로 포착하면서도 기존 정사영 모델의 안정성을 유지하기 위해, 3D 모퍼블 모델 회귀를 위한 새로운 축소 파라미터가 포함된 의사 원근 카메라 모델을 제안합니다.

Toby Chong, Ryota Nakajima

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

거울 속의 나, 왜 코가 작아 보일까?

"단일 카메라 3D 얼굴 모델"의 새로운 시선 (Revisiting an Old Perspective)

이 논문은 우리가 스마트폰으로 셀카를 찍거나, 헤드마운트 카메라 (머리에 쓰는 카메라) 로 영상을 찍을 때 발생하는 **'코가 작아 보이는 문제'**를 해결하기 위해 고안된 새로운 기술을 소개합니다.

간단히 말해, **"2D 사진 속 얼굴을 3D 로 재현할 때, 왜 코가 납작해지고 턱선이 공중에 뜰까?"**라는 질문에 대한 해답입니다.


1. 문제 상황: "원근감"을 잊어버린 카메라

우리가 사진을 찍을 때, 카메라는 **원근감 (Perspective)**을 가지고 있습니다.

  • 비유: 손가락을 코 앞에 대고 한쪽 눈을 감으면 손가락이 코보다 훨씬 커 보입니다. 이것이 원근감입니다. 코는 얼굴에서 가장 튀어나온 부분이라 카메라에 가장 가깝기 때문에, 실제보다 더 크게 보입니다.

하지만 기존에 쓰이던 3D 얼굴 모델링 기술 (3DMM) 은 이 원근감을 무시하고 **등각 투영 (Orthographic Projection)**이라는 방식을 썼습니다.

  • 비유: 마치 현미경이나 투명 유리판을 통해 얼굴을 보는 것과 같습니다. 거리가 멀어지거나 가까워지더라도 크기가 변하지 않고, 모든 부분이 똑같은 비율로 평평하게 비춰집니다.

그 결과 어떤 일이 생길까요?

  • 코가 작아집니다: 실제로는 코가 튀어나와서 커야 하는데, 평평하게 처리되니 작게 재현됩니다.
  • 턱선이 뜹니다: 얼굴 윤곽이 실제보다 더 넓게 퍼져 보이는 '뇌가 커지는 (Expanding Brain)' 현상이 발생합니다.

2. 해결책: "스마트한 축소 버튼" 추가하기

저자들은 기존 기술의 뼈대는 그대로 두되, **새로운 '축소 파라미터 (Shrinkage Parameter, ρ)'**라는 버튼을 하나 추가했습니다.

  • 비유: 기존 3D 모델이 평평한 종이라면, 이 새로운 기술은 종이의 중앙을 살짝 들어 올리는 것과 같습니다.
  • 작동 원리:
    • 이 'ρ (로우)'라는 숫자가 0이면, 기존처럼 평평한 원근감이 없는 상태입니다.
    • 이 숫자가 커질수록, 코처럼 카메라에 가까운 부분은 더 크게, 귀처럼 먼 부분은 더 작게 표현됩니다. 마치 망원경과 광각렌즈의 중간 같은 효과를 내는 것입니다.

이 방식의 가장 큰 장점은 기존에 훈련된 모델 (Orthogonal Projection 사용) 을 버리지 않고도, 이 '축소 버튼'만 추가해서 미세 조정 (Fine-tuning) 이 가능하다는 점입니다. 마치 오래된 자동차에 최신 내비게이션을 달아서 성능을 높이는 것과 같습니다.

3. 실험: "머리에 달린 카메라"로 증명하다

이 기술이 얼마나 효과적인지 확인하기 위해, 저자들은 **헤드마운트 카메라 (HMC)**로 찍은 100 만 장의 사진을 직접 만들었습니다.

  • 상황: 카메라가 얼굴에서 불과 15~30cm 거리까지 다가와 찍은 사진들입니다. 이럴 때는 원근감이 극단적으로 강하게 나타납니다.
  • 결과:
    • 기존 모델: 코가 작아지고 턱선이 비현실적으로 넓어졌습니다.
    • 새로운 모델: 코의 크기가 자연스럽게 표현되었고, 얼굴 윤곽도 실제와 비슷해졌습니다.

사람들이 직접 투표한 결과 (Perception Study) 에서도, 새로운 모델이 만든 3D 얼굴이 실제 사진과 가장 닮았다는 평가를 받았습니다.

4. 왜 기존 방식은 안 됐을까? (유사한 문제)

논문은 왜 단순히 '원근감'을 계산하는 기존 방식을 바로 적용하지 않았는지 설명합니다.

  • 비유: 카메라의 **초점 거리 (f)**와 **피사체와의 거리 (z)**는 서로 얽혀 있습니다. 얼굴이 작게 보인 이유가 "얼굴이 멀리 있어서"일 수도 있고, "렌즈가 좁아서"일 수도 있습니다. 이 두 가지를 동시에 맞추는 것은 매우 어렵습니다.
  • 해결: 그래서 저자들은 복잡한 거리 계산을 하지 않고, **"얼굴이 얼마나 왜곡되어 보이는가?"**를 직접 조절하는 'ρ'라는 하나의 숫자만 학습하게 했습니다. 이렇게 하면 기존 모델의 안정성을 해치지 않으면서도 원근감 효과를 자연스럽게 얻을 수 있습니다.

5. 결론: 셀카와 헤드캠을 위한 혁신

이 연구는 **"가까운 거리에서 찍은 얼굴 사진 (셀카, 헤드캠 영상) 을 3D 로 만들 때, 코가 작아지는 실수를 막아준다"**는 것을 증명했습니다.

  • 기존: 멀리서 찍은 사진 (스튜디오) 에는 좋았지만, 가까이서 찍은 사진에는 코가 납작해짐.
  • 새로운 기술: **ρ (축소 파라미터)**를 추가하여, 코가 튀어나온 것처럼 자연스럽게 표현됨.

이 기술은 영화 제작, 메타버스 아바타, 게임 캐릭터 제작 등 가까운 거리에서 얼굴을 정교하게 재현해야 하는 모든 분야에 큰 도움이 될 것입니다. 마치 2D 평면 그림에 입체감을 불어넣어, 우리가 보는 거울 속의 모습을 더 사실적으로 만들어주는 마법 같은 기술이라고 할 수 있습니다.