DenoiseSplat: Feed-Forward Gaussian Splatting for Noisy 3D Scene Reconstruction

该论文提出了 DenoiseSplat,一种针对含噪多视图图像的自监督前馈 3D 高斯泼溅方法,通过在大规模构建的 RE10K 噪声基准上仅利用干净 2D 渲染进行端到端训练,实现了在噪声环境下优于现有基线的 3D 场景重建与新颖视图合成性能。

Fuzhen Jiang, Zhuoran Li, Yinlin Zhang

发布于 Wed, 11 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 DenoiseSplat 的新技术,它能让计算机在图片很脏、很模糊的情况下,依然能重建出清晰、漂亮的 3D 世界。

为了让你更容易理解,我们可以把这项技术想象成**“在暴风雨中修复破碎的拼图”**。

1. 背景:为什么我们需要它?

想象一下,你想用几张照片重建一个 3D 的虚拟房间(就像玩 VR 游戏或制作数字电影)。

  • 以前的方法(NeRF 或 3DGS): 就像是一个挑剔的画家。他要求你给他的照片必须非常清晰、没有噪点、光线完美。如果照片上有灰尘、噪点或者模糊(就像现实生活中的手机随手拍的视频),这位画家就会“崩溃”,画出来的 3D 房间全是乱码、模糊不清,甚至根本建不起来。
  • 现实情况: 我们手里的照片往往不完美。手机拍的视频有噪点,网络下载的图片有压缩痕迹,光线不好时还有雪花点。以前的技术对这些“脏照片”束手无策。

2. 以前的笨办法:先擦干净,再画画

面对脏照片,工程师们以前通常用一种**“两步走”**的笨办法:

  1. 第一步(擦窗户): 先找一个人工智能去把每一张照片单独擦干净(去噪)。
  2. 第二步(画画): 把擦干净的照片交给那个挑剔的画家去画 3D 房间。

这个办法的问题:

  • 过度清洁: 那个擦窗户的人(去噪 AI)太用力了,把照片里原本就模糊的细节(比如头发的丝、砖墙的纹理)也一起擦掉了,导致照片虽然干净了,但变得像“塑料”一样假。
  • 各自为战: 他是一张一张照片单独擦的,没考虑到照片和照片之间的关联性。结果就是,从左边看和从右边看,房间的墙壁对不上,3D 结构就崩塌了。
  • 效率低: 还要跑两个程序,太慢了。

3. DenoiseSplat 的聪明做法:在画画时直接“去噪”

这篇论文提出的 DenoiseSplat,换了一种更聪明的思路:让画家直接在“暴风雨”中画画,并且学会自己把画里的污渍洗掉。

它不再把“擦窗户”和“画画”分开,而是训练画家直接看着脏照片,脑子里自动过滤掉噪音,画出干净的 3D 世界

它的两个核心“超能力”:

超能力一:双核大脑(几何与外观分离)
想象画家的大脑分成了两个部门:

  • 结构部(几何分支): 只负责画骨架(墙壁在哪里、桌子多高)。这个部门很“固执”,它不看颜色,只看形状。因为形状通常比较稳定,不容易被噪音干扰。
  • 装饰部(外观分支): 负责画颜色和纹理(墙是红的还是绿的,上面有没有花纹)。这个部门比较“灵活”,专门负责处理那些因为噪音导致的颜色乱跳。
  • 效果: 即使照片很脏,结构部也能稳稳地画出房间的轮廓,不会乱;装饰部则努力修正颜色。这样画出来的 3D 房间,骨架是正的,颜色也是对的

超能力二:智能边界修正(CBC)
有时候,墙壁和地板交界的地方(边界)最容易出错。

  • DenoiseSplat 会告诉装饰部:“嘿,结构部说这里是个墙角,而且它有点拿不准,你在这里要特别小心,把颜色修得锐利一点,不要糊成一团。”
  • 这就像是一个经验丰富的老工匠,在修补破损的壁画时,知道哪里该用力,哪里该轻柔,确保边缘清晰,不会把墙角的线条抹平。

4. 他们是怎么训练的?(造了一个“脏照片”实验室)

为了训练这个画家,作者们做了一个大工程:

  • 他们找来了 1 万多个真实的房地产视频(RE10K 数据集),这些视频本来是干净的。
  • 然后,他们像做实验一样,故意往这些视频里加各种“佐料”:
    • 高斯噪声(像电视雪花)
    • 泊松噪声(像相机感光元件的颗粒)
    • 椒盐噪声(像照片上随机出现的黑白点)
    • 斑点噪声
  • 关键点: 他们确保同一个房间的所有照片,加的是同一种“佐料”,而且程度一样。这模拟了现实中:如果你用同一台手机在同一个房间拍视频,所有照片的噪点特征应该是一致的。
  • 然后,他们让 AI 看着这些故意弄脏的照片,目标是让它画出原本干净的照片的样子。AI 不需要知道 3D 的正确答案,只要画出来的图看起来干净就行。

5. 结果怎么样?

实验结果显示,DenoiseSplat 完胜:

  • 比“直接画”强: 以前那种直接看脏照片画的方法,画出来全是噪点。
  • 比“先擦后画”强: 它画出来的东西,细节更丰富(没有把头发丝擦掉),结构更稳固(墙壁不会歪),而且速度更快(一步到位,不用先跑一个去噪程序)。

总结

DenoiseSplat 就像是一个拥有“透视眼”和“自我净化能力”的 3D 重建大师。它不再抱怨照片脏,而是学会了在混乱中理清秩序,直接从我们随手拍的、充满噪点的手机视频里,重建出清晰、真实、高质量的 3D 世界。这对于未来的 VR 体验、机器人导航(机器人看到的画面往往很脏)以及数字内容创作来说,是一个巨大的进步。