SOMA: Unifying Parametric Human Body Models

이 논문은 SMPL, SMPL-X 등 서로 호환되지 않는 다양한 파라메트릭 인간 신체 모델 간의 상호운용성을 해결하기 위해, 메쉬 토폴로지, 골격, 포즈를 추상화하여 단일 백엔드로 통합하는 SOMA 프레임워크를 제안합니다.

Jun Saito, Jiefeng Li, Michael de Ruyter, Miguel Guerrero, Edy Lim, Ehsan Hassani, Roger Blanco Ribera, Hyejin Moon, Magdalena Dadela, Marco Di Lucca, Qiao Wang, Xueting Li, Jan Kautz, Simon Yuen, Uma
게시일 2026-03-18
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

SOMA: 모든 3D 캐릭터를 하나로 묶어주는 '만능 번역기'

NVIDIA 에서 발표한 SOMA라는 새로운 기술은 3D 캐릭터와 인간 모델을 다루는 방식에 혁명을 일으킬 것 같습니다. 이 기술을 쉽게 이해할 수 있도록 일상적인 비유로 설명해 드리겠습니다.

1. 문제 상황: 서로 다른 언어를 쓰는 친구들

지금까지 3D 인간 모델을 만드는 데는 SMPL, MHR, Anny 등 여러 가지 방식 (모델) 이 있었습니다. 하지만 이 친구들은 서로 말이 통하지 않았습니다.

  • SMPL은 "내 몸은 이 모양이야"라고 말하지만, Anny는 "내 몸은 저 모양이야"라고 합니다.
  • MHR은 "내 뼈 길이가 달라"라고 하고, GarmentMeasurements는 "옷 치수가 중요해"라고 합니다.

이런 상황은 마치 한국어, 영어, 프랑스어를 쓰는 세 친구가 한 방에 모여서 춤을 추려고 할 때와 같습니다.

  • 한국 친구는 한국 춤을 추고, 프랑스 친구는 발레를 추고, 영어 친구는 힙합을 춥니다.
  • 서로 춤을 맞춰주려면, 한국 친구가 프랑스 춤을 배워야 하고, 프랑스 친구가 한국 춤을 배워야 합니다. (이걸 '어댑터'라고 부릅니다.)
  • 친구가 5 명이면 서로 10 가지 조합을 모두 배워야 해서 너무 복잡하고 비효율적입니다.

2. SOMA 의 해결책: '만능 번역기'와 '공통 무대'

SOMA 는 이 문제를 해결하기 위해 세 가지 마법 같은 단계를 제안합니다.

① 공통 무대 만들기 (메쉬 토폴로지 추상화)

SOMA 는 모든 친구들을 **하나의 공통된 무대 (SOMA 토폴로지)**로 초대합니다.

  • 한국 친구든, 프랑스 친구든, 이 무대 위에 서면 모두 동일한 옷차림과 몸 구조를 갖게 됩니다.
  • 마치 모든 나라의 춤꾼들이 같은 의상과 같은 무대를 공유하는 것과 같습니다.
  • 이 과정은 아주 빠릅니다. 컴퓨터가 미리 계산해 둔 '지도'만 보면 되어서, 실시간으로 몸의 모양을 변환할 때 신경 쓸 필요가 없습니다.

② 춤 동작을 통일하기 (포즈 추상화)

이제 춤 동작 (포즈) 을 통일합니다.

  • 예전에는 한국 춤꾼이 프랑스 춤 동작을 따라 하려면, 프랑스 춤 동작을 한국 춤꾼의 몸짓으로 다시 번역해야 했습니다.
  • SOMA 는 모든 춤 동작을 'SOMA 춤'이라는 공통 언어로 번역해 줍니다.
  • 이제 한국 친구든, 프랑스 친구든 **같은 춤 동작 (SOMA 포즈)**을 받으면, 각자의 몸매에 맞춰서 자연스럽게 춤을 춥니다.
  • 중요한 점: 이 번역기는 학습이 필요 없습니다. 수학적 공식을 바로 적용해서 순식간에 번역해냅니다.

③ 자연스러운 움직임 추가 (포즈 커렉티브)

인간은 팔을 구부릴 때 팔꿈치가 꺾이는 것처럼 자연스러운 움직임이 필요합니다.

  • 예전에는 각 모델마다 이 자연스러운 움직임을 따로따로 배워야 했습니다.
  • SOMA 는 **하나의 '자연스러운 움직임 AI'**를 만들어서 모든 친구에게 공유합니다.
  • 이 AI 가 "팔꿈치를 구부릴 때 이렇게 살이 찌부러져야 해"라고 알려주면, 모든 모델이 똑같이 자연스럽게 움직입니다.

3. SOMA 가 가져온 변화

이제 이 기술이 적용되면 어떤 일이 일어날까요?

  • 자유로운 조합: 연구자나 개발자는 "Anny 모델의 아기 몸매"에 "SMPL 모델의 춤 동작"을 바로 붙일 수 있습니다. 별도의 번거로운 변환 과정 없이 바로 가능합니다.
  • 속도: 이 모든 과정이 **GPU(그래픽 카드)**에서 매우 빠르게 돌아갑니다. 초당 수천 개의 캐릭터를 처리할 수 있을 정도로 빠릅니다.
  • 정확도: 서로 다른 모델을 섞어도 몸의 모양이 찌그러지지 않고, 원래의 특징을 잘 살려줍니다.

4. 마치...

SOMA 는 **3D 인간 모델 세계의 '유니버설 어댑터'**이자 **'만능 번역기'**입니다.
이전에는 서로 다른 모델끼리 대화하려면 각각의 언어를 배워야 했지만, SOMA 는 모든 모델을 하나의 공통 언어로 바꿔주어 서로 자유롭게 소통하고 협업할 수 있게 해줍니다.

이제 3D 캐릭터를 만드는 일은 더 이상 "언어 장벽"에 시달리는 일이 아니라, 자유롭게 창의성을 발휘하는 즐거운 놀이가 될 것입니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →