ReSpace: Text-Driven Autoregressive 3D Indoor Scene Synthesis and Editing

ReSpace 是一个基于自回归机制的文本驱动生成框架,通过引入包含显式房间边界的紧凑结构化场景表示及偏好对齐训练,实现了支持自然语言指令的 3D 室内场景合成与编辑,并在物体添加和整体场景质量上超越了现有技术。

Martin JJ. Bucher, Iro Armeni

发布于 2026-03-24
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 ReSpace 的新系统,你可以把它想象成一位拥有“读心术”和“空间魔法”的虚拟室内设计师

以前,让电脑自动设计房间非常困难,要么设计出来的东西很呆板(像乐高积木一样生硬),要么电脑根本听不懂人话,或者只能处理方方正正的普通房间。ReSpace 的出现,就是为了解决这些痛点,让普通人也能通过简单的文字对话,轻松指挥电脑生成或修改 3D 室内场景。

下面我用几个生动的比喻来拆解它的核心功能:

1. 核心概念:把房间变成“乐高说明书” (结构化场景表示)

以前的电脑设计房间,可能像是在玩泥巴,很难精确控制每一块的位置。
ReSpace 则不同,它把房间看作一本结构清晰的“乐高说明书”(JSON 格式)。

  • 房间边界:它清楚地知道墙壁在哪里,天花板多高,就像画好了房间的“地基线”。
  • 家具描述:它不只是说“放把椅子”,而是会记录“一把深灰色的、带纽扣装饰的现代沙发”。
  • 资产无关:最棒的是,这个“说明书”不绑定具体的家具模型。就像你写“放一张床”,系统可以自动从成千上万种床的模型库里,挑出一张大小合适、风格匹配的床放上去。这意味着你可以随时更换家具库,而不用重新训练整个系统。

2. 工作原理:像写小说一样“接龙” (自回归生成)

ReSpace 生成场景的过程,就像玩“成语接龙”或写小说

  • 你给它一个指令(比如“加一个现代球形灯”)。
  • 它不是凭空变出整个房间,而是像写故事一样,一个词一个词地预测下一个物体应该放在哪里。
  • 它先预测“灯”这个词,然后预测“灯”的大小、位置、旋转角度,最后把这些信息拼凑起来,变成具体的 3D 物体。
  • 这个过程是自动且连续的:你加完一个,它接着加下一个,直到房间填满。

3. 三大魔法能力

ReSpace 不仅能从头造房间,还能像真正的装修队一样进行编辑

  • 添加 (Add):你说“加一个带黑色花盆的植物”,它就能在合适的位置(比如角落或窗边)放上一盆,而且不会挡住路。
  • 移除 (Remove):你说“把那个植物拿走”,它就能精准地找到并删除,不会误删旁边的桌子。
  • 替换 (Swap):你说“把书架换成木制衣柜”,它就能把旧家具拿走,换上一个风格协调的新衣柜。

4. 为什么它更聪明?(训练与评估)

  • 像老师教学生一样训练:研究人员不仅教它怎么放家具,还给它“打分”。如果它把椅子塞进桌子底下(这是合理的),或者把灯挂到了天花板上(这是错误的),系统会给予奖励或惩罚。通过这种偏好对齐,它学会了人类喜欢的布局,而不仅仅是数学上正确的布局。
  • 像素级体检 (体素化评估):以前的评估方法只看家具的“大框框”(包围盒),就像只看一个人的轮廓。ReSpace 发明了一种新方法,把房间切成无数个小方块(体素),像CT 扫描一样检查。它能发现细微的碰撞(比如椅子腿是否真的插进了地毯里,或者灯是否真的挂在了天花板下),确保布局在物理上是真实的。

5. 实际效果:像真人一样思考

在实验中,ReSpace 的表现超越了现有的最先进方法:

  • 懂非规则房间:它不仅能处理方方正正的盒子房间,还能处理有斜角、不规则形状的复杂户型。
  • 听人话:它能理解复杂的自然语言指令,比如“加一个舒适的、带软垫的深灰色沙发”,而不是只能听懂冷冰冰的代码。
  • 人类更喜欢:在让人类评委打分时,ReSpace 生成的房间被认为更自然、更美观,甚至比那些专门针对“生成整个房间”训练过的模型还要好。

总结

ReSpace 就像是一个懂你心思的 AI 装修助手。
你不需要懂 3D 建模,也不需要懂复杂的代码。你只需要像跟朋友聊天一样说:“我想把客厅变得更温馨,加个落地灯,把旧沙发换成布艺的。”ReSpace 就能理解你的意图,自动规划空间,挑选合适的家具,并摆放得恰到好处,甚至还能帮你把不喜欢的东西撤走。

这项技术让未来的室内设计变得像聊天一样简单,让每个人都能轻松拥有自己梦想中的家。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →