GloSplat: Joint Pose-Appearance Optimization for Faster and More Accurate 3D Reconstruction

GloSplat 提出了一种在 3D 高斯泼溅训练中联合优化位姿与外观的框架,通过保留显式 SfM 特征轨迹作为独立可优化参数,有效解决了传统纯光度优化方法易出现的位姿漂移问题,实现了比现有 COLMAP 依赖及免依赖方法更快速、更精准的 3D 重建。

Tianyu Xiong, Rui Li, Linjie Li, Jiaqi Yang

发布于 2026-03-06
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

想象一下,你想用几十张手机拍的照片,在电脑里重建一个逼真的 3D 世界(比如你的客厅,或者一座古老的城堡)。

以前的方法就像是一个分工明确但沟通不畅的流水线工厂

  1. 第一道工序(SfM):先让一个“测量员”拿着尺子去量,确定每张照片是在什么角度拍的(相机位姿)。一旦量完,测量员就下班了,他的数据被“冻结”了。
  2. 第二道工序(3D 重建):然后让一个“画家”拿着这些固定的数据去画画(生成 3D 模型)。

问题出在哪?
如果第一道工序的测量员量错了(比如把角度搞偏了),第二道工序的画家就算画技再高超,画出来的房子也是歪的。而且,画家在画画的过程中发现“哎,这面墙好像不对劲”,但他不能回头去告诉测量员“你量错了”,因为两人之间有一堵墙(数据是冻结的)。这导致重建出来的 3D 世界经常是模糊的、扭曲的。


GloSplat 做了什么?(核心创新)

这篇论文提出的 GloSplat,就像把这个流水线工厂改成了一个超级协作团队

1. 让“测量员”和“画家”一起工作(联合优化)

GloSplat 不再把“测量角度”和“画 3D 图”分开。它让这两个过程同时发生、互相配合

  • 以前:测量员量完就定死了。
  • 现在:画家在画画时,如果发现画面有点歪,可以立刻反馈给测量员:“嘿,这个角度好像不对,微调一下!”测量员调整角度后,画家再重新画。两人你追我赶,直到画面完美。

2. 保留“老照片”作为锚点(持久特征追踪)

这是 GloSplat 最聪明的地方。
在以前的“联合优化”方法中,如果刚开始画的时候,3D 模型还很稀疏(像还没长肉的骨架),画家很容易画跑偏(因为缺乏参照物)。
GloSplat 在训练过程中,特意保留了一组“原始测量点”(就像在墙上钉了几个钉子,或者保留了几张老照片的标记)。

  • 比喻:想象你在画一幅巨大的壁画。刚开始你只画了几个轮廓,很容易画歪。GloSplat 会在旁边放几个固定的参照物(比如墙上的挂钟)。无论你怎么调整画笔,你都会时不时看一眼挂钟,确保自己没画歪。
  • 作用:这组“参照物”(特征点)独立于画家正在画的“肉”(3D 高斯球)存在。它们像一样,死死地抓住几何结构,防止在刚开始训练时整个模型“漂移”或崩塌。

3. 两个版本:快刀手 vs. 精雕师

为了适应不同需求,GloSplat 有两个版本:

  • GloSplat-F (Fast,快刀手)
    • 策略:它不把所有照片两两对比(那样太慢了),而是用智能检索,只找最相似的几张图来对比。
    • 比喻:就像找朋友,你不需要把全城的人问一遍,只需要问几个最可能认识你的朋友。
    • 结果:速度极快,比传统方法快 13 倍,而且不需要依赖那个笨重的“测量员”(COLMAP),但画质依然吊打其他同类快速方法。
  • GloSplat-A (Accurate,精雕师)
    • 策略:它把所有照片都两两对比,不放过任何细节。
    • 比喻:就像做手术,把每一寸皮肤都检查一遍。
    • 结果:画质达到了目前的世界最高水平,甚至超过了那些依赖传统“测量员”的最强方法。

总结:为什么这很厉害?

  • 打破隔阂:它打破了“先测量、后重建”的旧规矩,让两者在过程中不断互相纠正。
  • 防止跑偏:通过保留“老锚点”(特征追踪),它解决了早期训练容易“画歪”的难题。
  • 又快又好:它证明了,只要方法对,既可以像闪电一样快(GloSplat-F),也可以像钻石一样精(GloSplat-A)。

一句话概括
GloSplat 就像是一个既懂测量又懂画画,并且手里还拿着“指南针”的超级艺术家,它不再依赖死板的步骤,而是通过不断的自我修正和互相配合,用最快的速度画出了最完美的 3D 世界。