SOMA: Unifying Parametric Human Body Models

本文提出了 SOMA,一种通过网格拓扑、骨骼和姿态三个抽象层,将 SMPL、SMPL-X 等异构参数化人体模型统一为单一后端,从而消除模型间不兼容性并实现高效、可微分且无需定制重定向的混合推理的框架。

Jun Saito, Jiefeng Li, Michael de Ruyter, Miguel Guerrero, Edy Lim, Ehsan Hassani, Roger Blanco Ribera, Hyejin Moon, Magdalena Dadela, Marco Di Lucca, Qiao Wang, Xueting Li, Jan Kautz, Simon Yuen, Uma
发布于 2026-03-18
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 SOMA 的新技术,它就像是为各种不同“性格”的 3D 人体模型建立了一个通用的“翻译官”和“通用骨架”

为了让你更容易理解,我们可以把现在的 3D 人体模型世界想象成一个语言不通的联合国

🌍 背景:混乱的“联合国”

在电脑图形学和人工智能领域,有很多不同的 3D 人体模型(比如 SMPL、MHR、Anny 等)。它们各自为政:

  • SMPL 像是一个讲“英语”的模型,擅长快速生成,但细节不够丰富。
  • MHR 像是一个讲“德语”的模型,对骨骼长度非常精确,适合做骨骼分析。
  • Anny 像是一个讲“法语”的模型,专门研究从婴儿到老人的各种体型,甚至能模拟不同年龄。
  • GarmentMeasurements 则像是一个讲“意大利语”的模型,专门为了做衣服量身定做。

问题在于: 如果你想让一个用“英语”生成的动作(比如跳舞),穿在“法语”模型身上,或者让“德语”模型的衣服穿在“意大利语”模型身上,以前几乎是不可能的。你需要为每一对模型(英语 - 法语、英语 - 德语、法语 - 德语……)专门编写一套复杂的转换代码。如果有 5 个模型,你就需要写 5×5=255 \times 5 = 25 套代码;如果有 10 个模型,就要写 100 套!这太麻烦了,而且容易出错。

💡 解决方案:SOMA 的“通用翻译官”

NVIDIA 提出的 SOMA 就是为了解决这个混乱局面。它不试图消灭这些不同的模型,而是给它们建了一个**“通用中转站”**。

SOMA 的核心思想是:不管你是哪种模型,先把你变成“标准人”,然后再做你想做的事。

它通过三个神奇的步骤来实现:

1. 拓扑抽象:把“不同形状的泥巴”捏成“同一个模具”

  • 比喻:想象你有不同形状的橡皮泥(有的像 SMPL 那样简单,有的像 MHR 那样复杂)。SOMA 有一个**“万能模具”**(Canonical Mesh)。
  • 怎么做:SOMA 会瞬间把任何形状的橡皮泥,通过一种数学魔法(3D 重心坐标插值),完美地“压”进这个万能模具里。
  • 结果:不管原来模型长什么样,现在它们都拥有了完全相同的皮肤网格结构。就像所有人都换上了同一套标准制服,虽然内在性格(体型)不同,但外表结构一样了。

2. 骨骼抽象:给“标准人”装上“智能骨架”

  • 比喻:现在大家都有了标准皮肤,但怎么动呢?以前每个模型的骨头位置都不一样。SOMA 发明了一种**“自动骨架适配”**技术。
  • 怎么做:它不需要人工去调整,而是通过数学公式,瞬间计算出这个新体型下,骨头应该长多长、关节应该在哪。
  • 结果:无论是一个大胖子还是一个小瘦子,SOMA 都能瞬间给他们生成一套完美贴合的、独一无二的骨骼系统

3. 姿态抽象:把“方言动作”翻译成“普通话动作”

  • 比喻:这是最厉害的一步。假设你有一个用 SMPL 模型录制的跳舞视频(方言动作),你想让 Anny 模型(法语模型)跳出来。
  • 怎么做:SOMA 有一个**“反向翻译器”**。它能看懂 SMPL 模型是怎么动的,然后瞬间算出“如果 Anny 模型要跳这个舞,它的关节应该转多少度”。
  • 结果:你不需要重新训练 AI,也不需要手动调整。只要把动作数据给 SOMA,它就能让任何支持的模型跳出一模一样的舞,而且动作非常自然,没有那种关节扭曲的怪相。

🚀 为什么这很酷?(SOMA 的超能力)

  1. 化繁为简(从 O(M2)O(M^2)O(M)O(M)
    以前,每增加一个新模型,就要和所有旧模型重新对接,工作量是爆炸式增长的。现在,你只需要把新模型接入 SOMA 这个“中转站”一次。以后,所有模型之间都可以自由互换身份和动作,就像所有国家都加入了同一个联合国,大家只说一种“通用语”。

  2. 即插即用
    你想用 Anny 的“婴儿体型”加上 SMPL 的“舞蹈动作”?没问题。你想用 MHR 的“骨骼精度”加上 GarmentMeasurements 的“衣服数据”?也没问题。SOMA 让这一切在推理时(也就是实际使用时)瞬间完成。

  3. 超级快且精准
    这个系统是在 GPU 上运行的,速度极快(每秒能处理几千个模型)。而且它非常聪明,能解决以前常见的“关节弯曲时皮肤破裂”或“肩膀乱跳”的问题,通过一个统一的“修正模型”让动作看起来像真的一样。

🎯 总结

SOMA 就像是一个“人体模型的瑞士军刀”或者“通用适配器”。

它不再强迫你只选一种模型,也不再让你在不同模型之间痛苦地做转换。它建立了一个统一的底层标准,让所有的 3D 人体模型都能在这个标准下自由交流、混合搭配。

  • 以前:你想让 A 模型做 B 模型的动作,需要专门修一条路(写代码),路修好了,A 和 B 才能通。
  • 现在:SOMA 建了一个巨大的立交桥。A 模型开上来,B 模型开上来,大家直接换道,瞬间互通。

这项技术将极大地推动虚拟人、游戏动画、电影特效以及 AI 生成动作的发展,让创作者可以像搭积木一样,自由组合不同模型的优点,创造出更逼真、更多样化的数字人类。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →