A Survey on 3D Gaussian Splatting

本文首次系统综述了 3D 高斯泼溅(3D GS)技术的原理、关键进展、在虚拟现实等场景中的实际应用、主流模型的对比评估以及当前挑战与未来研究方向。

Guikun Chen, Wenguan Wang

发布于 2026-04-10
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文是一篇关于**3D 高斯泼溅(3D Gaussian Splatting,简称 3D GS)**技术的全面“体检报告”和“未来指南”。

为了让你轻松理解,我们可以把重建 3D 世界想象成**“用乐高积木搭建一个逼真的虚拟房间”**。

1. 以前的做法:NeRF(像“隐形墨水”)

在 3D GS 出现之前,最流行的技术叫 NeRF

  • 比喻:NeRF 就像是用**“隐形墨水”**画出来的房间。它没有具体的积木,而是一段复杂的“魔法代码”(神经网络)。
  • 怎么工作:当你想看房间里的某个点时,你必须向这段代码提问:“这个位置的光是什么颜色?密度是多少?”代码算出答案,你才能看到。
  • 缺点
    • 太慢:就像你要看房间,得先问一遍代码,算一遍,再问下一点。想画出一张高清图片,电脑得算很久,没法实时玩 VR。
    • 难修改:因为它是“隐形”的,你想把墙上的画换掉,或者把桌子移走,你得重新训练整个“魔法代码”,非常麻烦。

2. 现在的做法:3D GS(像“千万颗发光的尘埃”)

这篇论文介绍的主角 3D GS,彻底改变了游戏规则。

  • 比喻:3D GS 不再用隐形墨水,而是直接往房间里撒了几百万颗发光的、会旋转的“小尘埃”(3D 高斯球)
    • 每一颗尘埃都有自己的位置、大小、旋转角度、颜色和透明度
    • 这些尘埃不是乱撒的,而是通过算法“训练”出来的,它们聚在一起,刚好能拼出你看到的房间样子。
  • 怎么工作
    • 泼溅(Splatting):想象你拿着相机,把这些尘埃直接“泼”到照片上。因为尘埃是实实在在的物体,计算机不需要去“猜”光线,只需要把尘埃按顺序叠在一起(就像叠罗汉),就能瞬间算出画面。
    • 速度:因为尘埃是显式的(看得见的),计算机可以并行处理(大家一起干),所以渲染速度极快,能达到每秒几十帧甚至上百帧,让 VR 和实时游戏成为可能。
    • 好编辑:如果你想把桌子移走,直接删掉组成桌子的几颗尘埃就行;想换个颜色,直接改改尘埃的颜色参数就行。

3. 这篇论文讲了什么?(核心内容)

这篇论文就像一本**“3D 高斯百科全书”**,主要讲了以下几件事:

A. 原理揭秘(它是如何工作的?)

  • 它解释了如何从几张普通的照片,通过数学方法(优化),把几百万颗“尘埃”的位置和属性找出来,让它们完美拼成 3D 场景。
  • 它展示了“泼溅”的过程:把 3D 的尘埃投影到 2D 屏幕上,然后像画家一样一层层叠加颜色。

B. 它能做什么?(应用场景)

论文列举了 3D GS 正在改变很多领域:

  • 机器人导航:机器人可以瞬间“看清”周围环境,不再需要漫长的计算,能更快避障。
  • 动态场景:以前只能重建静止的房间,现在可以重建跳舞的人流动的河水。它能把每一帧的“尘埃”都动起来。
  • 数字人(Avatar):可以实时生成逼真的虚拟人,用于游戏或元宇宙,而且可以随意修改表情和动作。
  • 医疗手术:在微创手术中,医生可以通过内窥镜看到实时的 3D 组织重建,帮助精准手术。
  • 自动驾驶:快速重建巨大的城市街道场景,帮助自动驾驶汽车理解路况。

C. 现在的挑战与未来(哪里还不够好?)

虽然 3D GS 很厉害,但论文也指出了它现在的“阿喀琉斯之踵”:

  • 内存爆炸:几百万颗尘埃占用的内存很大,手机或普通电脑可能带不动。大家都在研究怎么“压缩”这些尘埃。
  • 稀疏视角:如果只给很少的照片(比如只有一张),重建出来的效果会有瑕疵(像鬼影)。
  • 特殊材质:对于镜子、玻璃这种反光特别强的东西,目前的“尘埃”还不太会画,容易糊掉。
  • 物理模拟:现在的尘埃只是“看起来”像物体,它们不会真的“碰撞”或“破碎”。未来的目标是让尘埃不仅能看,还能像真实物体一样发生物理反应(比如水溅开、玻璃碎裂)。

4. 总结

简单来说:
这篇论文告诉我们,3D 高斯泼溅就像是从“用魔法猜画面”进化到了“用几百万个乐高积木拼画面”。

  • 以前(NeRF):慢、难改、像黑盒。
  • 现在(3D GS):快如闪电、随意修改、清晰可见。

它被认为是 3D 重建领域的**“革命性技术”,正在把虚拟现实、机器人、电影特效和自动驾驶推向一个全新的、实时互动的时代。这篇论文就是给所有想进入这个领域的人(无论是新手还是专家)提供的一份最佳路线图**。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →