PD2^{2}GS: Part-Level Decoupling and Continuous Deformation of Articulated Objects via Gaussian Splatting

本文提出了 PD2^{2}GS 框架,通过高斯泼溅技术实现关节物体的部分级解耦与连续形变建模,无需人工监督即可在合成及真实数据上实现高精度的几何重建、运动学建模及连续控制,并发布了配套的 RS-Art 数据集以支持真实世界评估。

Haowen Wang, Xiaoping Yuan, Zhao Jin, Zhen Zhao, Zhengping Che, Yousong Xue, Jin Tian, Yakun Huang, Jian Tang

发布于 2026-03-03
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 PD2GS 的新系统,它的核心任务是给那些“能动的物体”(比如能开关的抽屉、能折叠的笔记本电脑、能转动的门)制作一个既逼真又能灵活变形的 3D 数字分身

为了让你更容易理解,我们可以把这项技术想象成给物体制作一套“智能乐高”或“数字皮套”

1. 以前的痛点:拼凑的“僵尸”

以前的方法(比如 PARIS 或 ArtGS)有点像在拼乐高,但它们只能拼出几个固定的姿势。

  • 问题:如果你想让一个抽屉从“全关”变到“全开”,以前的系统只能给你看“关”和“开”两张图,中间怎么动?它不知道。它甚至可能把抽屉和柜体“粘”在一起,导致你拉开抽屉时,整个柜子都跟着变形,或者抽屉和柜子互相穿模(重叠在一起)。
  • 比喻:这就像是用胶水把乐高积木粘死,你只能摆出几个固定的造型,想动一下中间的过程,模型就会散架或者变形得很奇怪。

2. PD2GS 的绝招:一套“万能变形皮套”

PD2GS 的做法完全不同,它不再试图拼凑一个个固定的状态,而是先建立一个**“标准形态”(Canonical State),然后给这个标准形态穿上一件“智能变形皮套”**。

  • 核心概念:高斯泼溅(Gaussian Splatting)
    • 比喻:想象物体不是由坚硬的砖块组成的,而是由无数个发光的、半透明的“小光点”(高斯球)组成的云。这些光点像云雾一样,可以随意流动、变形,但聚在一起就能形成清晰的物体形状。
  • 如何变形?(连续变形)
    • 系统学习了一个**“变形公式”**。当你输入一个“代码”(比如代表“抽屉拉开一半”的指令),这个公式就会指挥所有的小光点移动。
    • 关键点:它知道哪些光点属于“抽屉”,哪些属于“柜体”。当代码变化时,只有“抽屉”的光点跟着动,“柜体”的光点乖乖待着。
    • 比喻:这就像给物体穿了一件智能紧身衣。你拉一下袖子(代码),只有袖子部分变形,身体其他部分不受影响。而且,你可以随意拉出任何中间状态(比如拉开 37%),系统都能算出完美的样子,而不是只能看“全开”或“全关”。

3. 它是怎么知道“哪部分是抽屉,哪部分是柜体”的?(自动拆解)

这是论文最厉害的地方之一:它不需要人告诉它哪里是抽屉,哪里是门。

  • 粗分(看谁在动):系统先观察物体在不同状态下的变化。它发现有些光点“跑”得很远(动了),有些光点“纹丝不动”(没动)。它就把动的归为一类,不动的归为一类。
    • 比喻:就像在舞池里,系统一眼就能看出哪些人在跳舞(动了),哪些人在站着聊天(没动)。
  • 细分(用 AI 画边界):有时候,动的部分和不动的部分会混在一起(比如抽屉边缘)。这时候,系统会调用一个超级强大的 AI 画家(叫 SAM,Segment Anything Model)。
    • 系统会问 AI:“嘿,帮我把这个抽屉的边缘画清楚!”
    • AI 根据光点的运动轨迹,在 3D 空间里把边界切得干干净净,确保抽屉和柜体不会“穿模”。
    • 比喻:就像用一把智能激光刀,沿着物体运动的轨迹,把粘连在一起的“面团”精准地切开,变成独立的“抽屉”和“柜子”。

4. 为什么要做这个?(RS-Art 数据集)

为了证明这招真的管用,作者不仅用了电脑生成的假数据,还自己搞了一个**“真实世界实验室”(RS-Art 数据集)**。

  • 他们真的去拍了很多真实的物体(比如真实的抽屉、台灯、眼镜),然后用逆向工程把它们变成 3D 模型。
  • 比喻:就像为了证明新发明的“自动驾驶汽车”好用,他们不仅用模拟器跑,还真的把车开到了真实的街道上,甚至包括了复杂的红绿灯和行人。

5. 总结:PD2GS 带来了什么?

  • 更真实:做出来的 3D 模型,不管是静止的还是动的,看起来都像真的一样,没有那种“糊成一团”的模糊感。
  • 更灵活:你可以随意控制物体变形。比如,你可以让一个抽屉只拉开一半,或者让门只开 30 度,系统都能生成完美的中间状态。
  • 更智能:不需要人工去标注“这是抽屉,那是门”,系统自己就能通过观察运动把物体拆解清楚。

一句话总结
PD2GS 就像给复杂的可动物体(如家具、机器人)穿上了一套懂物理、会思考的“数字皮肤”。它不仅能完美还原物体的样子,还能让你像玩泥巴一样,随意捏出物体在任何角度、任何开合程度的样子,而且各个部件互不干扰,非常精准。这对于未来的机器人操作(让机器人学会开抽屉)、VR/AR 游戏(让虚拟家具能真实互动)以及数字孪生(给工厂设备做完美的数字备份)来说,是一个巨大的进步。