Space Syntax-guided Post-training for Residential Floor Plan Generation

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个关于**“如何让 AI 画的房子图纸更像人设计的”**的故事。

想象一下，你让一个刚学会画画的小学生（AI 模型）去画房子的平面图。他画了很多很多张，线条很直，房间形状也很规整，看起来挺像那么回事。但是，如果你住进去，可能会发现很奇怪：比如客厅（大家聚会的地方）被挤到了角落里，像个储藏室；而走廊或者玄关却大得像个广场，占据了房子的中心。

这就是目前 AI 生成户型图的一个大问题：它学会了“画形状”，但没学会“懂生活”。

这篇论文提出了一套名为 SSPT 的新方法，专门用来给这个“小学生”补课，让他不仅画得对，还要画得“懂规矩”。

1. 核心问题：AI 不懂“主次分明”

在人类建筑师眼里，房子是有等级的：

公共区（客厅、餐厅）：应该是房子的“心脏”，最开放、最容易到达，大家都能去。
私密区（卧室、卫生间）：应该是“卧室”，比较隐蔽，不容易被直接看到。

但是，普通的 AI 模型只是死记硬背了成千上万张真实户型图的数据。它发现“卧室”和“客厅”长什么样，但它没理解为什么客厅要在中间，卧室要在旁边。结果就是，它画出来的图虽然符合几何规则，但逻辑混乱，像个迷宫。

2. 解决方案：请一位“空间语法”老教授当考官

为了解决这个问题，作者请出了一位虚拟的**“空间语法老教授”**（Space Syntax Oracle）。

老教授的本领：他不看图好不好看，他只算**“连通性”**。他会把房子拆解成一个个小方块，然后计算：从房间里的任何一个点出发，走到其他所有地方，平均需要走几步？
- 如果客厅的步数最少（最中心），说明它很“核心”，老教授就给它打高分。
- 如果走廊的步数最少，说明客厅被挤到了边缘，老教授就给它打低分。

这个老教授就是论文里的**“非可微分神谕”（听起来很吓人，其实就是个自动打分器**）。它不懂数学公式，但它懂建筑逻辑。

3. 两种“补课”方法：SSPT

有了老教授，怎么让 AI 变聪明呢？论文提出了两种方法：

方法一：反复刷题法（SSPT-Iter）

做法：让 AI 画 1000 张图，老教授挑出其中最好的 100 张（客厅在中间的），把这 100 张当成“标准答案”，让 AI 重新学习。
缺点：这就像让学生做 1000 道题，老师只改前 100 道，然后让学生重做一遍。非常慢，而且很费时间（计算资源消耗大）。

方法二：强化学习法（SSPT-PPO）—— 论文的大亮点

做法：这就像打游戏练级。AI 每画一步，老教授就在旁边看着。画完了，老教授直接给一个分数（奖励）。AI 根据这个分数，调整自己的“手感”，下次画得更好。
比喻：
- Iter 方法像是：学生画完一幅画，老师把画撕了，只把画得好的那几张复印下来，让学生照着再画一遍。
- PPO 方法像是：学生画一笔，老师立刻说“这一笔往左一点好”，学生马上调整，全程互动，效率极高。
结果：论文发现，PPO 方法比反复刷题法快了 10 倍以上，而且画出来的图逻辑更清晰，更稳定。

4. 考试环境：SSPT-Bench (Eval-8)

为了公平起见，作者还设计了一个特殊的**“期末考试”**：

平时训练：只让 AI 画 7 个房间以下的户型（≤7 间）。
考试题目：突然给 AI 一个8 个房间的户型要求（这是 AI 没见过的，叫“分布外”测试）。
目的：看看 AI 是真的学会了“客厅要居中”的道理，还是只是死记硬背了 7 个房间的画法。

5. 最终效果

经过“老教授”的辅导（特别是用 PPO 方法）：

客厅真的变“核心”了：客厅在平面图中的位置更居中，更容易到达。
私密区更“隐蔽”了：卧室和卫生间被推到了边缘，不再抢戏。
效率超高：用 PPO 方法，AI 在极短的时间内就学会了这些建筑逻辑，而且画出来的图非常稳定，不会忽好忽坏。

总结

这篇论文就像给 AI 设计师装了一个**“建筑逻辑大脑”。它不再只是模仿形状，而是通过一个自动化的“空间考官”，教会 AI 理解“家”的深层逻辑**：哪里该热闹，哪里该安静。

最重要的是，他们发现用**“打游戏练级”（强化学习）的方式教 AI，比“反复刷题”（重新训练）**要快得多、好得多。这为未来 AI 辅助建筑设计提供了一条非常高效、实用的新路径。

Each language version is independently generated for its own context, not a direct translation.

1. 研究背景与问题 (Problem)

核心痛点：
现有的住宅平面图生成模型（如基于扩散模型、GAN 或图神经网络的方法）通常是在大规模数据集（如 RPLAN）上进行预训练，以拟合数据的统计分布。然而，这种“分布拟合”往往忽略了关键的建筑学先验知识，特别是住宅空间中公共空间（如客厅、门厅）的主导性和功能层级的合理性。

具体挑战：

空间逻辑缺失： 生成的平面图可能满足几何约束（如房间不重叠、尺寸合规），但在空间句法（Space Syntax）层面表现不佳。例如，私密空间（卧室、卫生间）可能比公共空间（客厅）具有更高的“整合度”（Integration），或者交通空间（走廊/入口）异常中心化，违背了“公共空间应作为空间核心”的建筑原则。
评估困难： 现有的评估指标多关注几何精度（IoU）或局部邻接关系，缺乏对深层空间配置逻辑（如可达性、层级结构）的自动化、大规模量化评估工具。
数据质量： 现有训练数据集中包含大量空间逻辑不合理或标注错误的样本，缺乏自动筛选机制。
后训练缺失： 大多数生成模型仅在预训练阶段优化，缺乏针对非可微分（Non-differentiable）建筑学目标的系统性后训练（Post-training）框架。

2. 方法论 (Methodology)

本文提出了 SSPT (Space Syntax-guided Post-training) 框架，旨在通过引入空间句法知识来优化扩散模型的生成过程。

2.1 核心组件：空间句法预言机 (Space Syntax Oracle)

由于空间句法指标（如整合度）的计算涉及离散图论操作，是不可微的，因此无法直接作为损失函数反向传播。作者设计了一个非可微的确定性预言机（Oracle）：

输入转换： 将生成的平面图（RPLAN 风格掩码）转换为矩形空间图（Rectangle-space Graph）。
- 使用贪心最大矩形分解算法将房间核心区域分解为凸多边形原子。
- 基于门和内部连通性构建节点间的边。
指标计算： 在图上计算整合度（Integration）（基于深度关系，如 HH 或紧密度）。
评分机制： 计算公共空间主导性（Public-space Dominance），即公共空间（主要是客厅）的整合度是否显著高于其他空间。

2.2 后训练策略 (Post-training Strategies)

SSPT 提出了两种利用该预言机进行后训练的策略：

SSPT-Iter (迭代重训练)：
- 流程： 生成候选样本 $\rightarrow$ 预言机评分 $\rightarrow$ 筛选高分样本（Top-K） $\rightarrow$ 使用筛选后的高质量数据对扩散模型进行微调（Fine-tuning）。
- 特点： 基于数据层面的聚合（Data Aggregation），类似于 DAgger 或自训练循环。
SSPT-PPO (基于 PPO 的强化学习)：
- 流程： 将扩散模型的逆向去噪过程建模为马尔可夫决策过程（MDP）。
- 奖励函数： 在生成轨迹结束时，利用预言机计算终端奖励（Terminal Reward），即空间句法评分。
- 优化： 使用**近端策略优化（PPO）**算法直接优化策略网络，最大化预期奖励。
- 特点： 在线优化，直接针对非可微目标进行梯度更新，无需重新构建数据集。

2.3 评估基准：SSPT-Bench (Eval-8)

为了公平评估模型在分布外（OOD）的泛化能力，设计了统一基准：

训练条件： 仅在 $\le 7$ 个房间的条件下进行后训练。
评估条件： 在恰好 8 个房间 的分布外场景下进行评估。
指标体系： 包含公共空间主导性（Public-space Dominance）、生活间相对整合度（Living-room Relative Integration）、生活间优势（Living-room Advantage）以及功能层级轮廓距离（Profile Distance）。

3. 主要贡献 (Key Contributions)

建筑先验的量化与形式化： 首次将空间句法中的“整合度”作为可计算的建筑先验，形式化为住宅平面图生成的评估和优化目标，确立了“公共空间主导性”原则。
自动化数据筛选与知识提取： 设计了基于矩形分解的自动化预言机，能够从大规模数据集中自动筛选出空间逻辑合理的样本，并量化了真实住宅中不同功能空间（公共 vs 私密）的整合度分布规律。
统一评估基准 (SSPT-Bench)： 提出了 Eval-8 基准和统一的指标套件，解决了现有评估中缺乏对功能层级和 OOD 泛化能力诊断的问题。
高效的后训练框架： 提出了 SSPT 框架，并通过实验证明，基于 PPO 的后训练策略在提升建筑合理性方面，比传统的迭代重训练策略具有**>10 倍的计算效率**，且能显著降低生成结果的方差。

4. 实验结果 (Results)

在 SSPT-Bench (Eval-8) 上的实验对比了基线模型（HouseDiffusion）、SSPT-Iter 和 SSPT-PPO：

公共空间主导性提升：
- SSPT-PPO 将中位数的 public_score 从基线的 0.1292 提升至 0.2244，优于 SSPT-Iter (0.1820)。
- 这意味着生成的平面图中，客厅作为空间核心的地位更加稳固。
功能层级更清晰：
- SSPT-PPO 显著降低了私密空间（卧室、卫生间）和交通空间（入口）的过度整合现象，使其更接近真实数据（RPLAN8）的分布。
- 生活间优势（living_adv）从 0.2413 提升至 0.3522。
稳定性与方差：
- PPO 策略显著降低了生成结果的方差（IQR 减少约 20%-30%），表明模型生成的空间结构更加可控和稳定。
计算效率：
- SSPT-PPO 的单次迭代耗时仅为 0.75 小时，而 SSPT-Iter 需要 8.30 小时。
- PPO 在提升指标的效率上比迭代重训练高出约 11 倍。
分布外泛化： 在仅用 $\le 7$ 房间数据训练的情况下，模型在 8 房间测试集上依然表现出优异的性能，证明了后训练策略有效学习了通用的空间逻辑而非简单的记忆。

5. 意义与展望 (Significance & Future Work)

学术与实践意义：

理论融合： 成功地将经典的建筑理论（空间句法）与前沿的生成式 AI（扩散模型、RL）相结合，为数据驱动的建筑设计提供了可解释、可优化的理论路径。
解决“幻觉”问题： 解决了生成模型虽然几何逼真但空间逻辑混乱的问题，使 AI 生成的方案更符合人类居住习惯。
高效优化范式： 证明了 PPO 在处理非可微分、基于规则的建筑设计目标时，比传统的数据筛选重训练方法更高效、更稳健。

未来方向：

多目标优化： 引入更多空间句法指标（如选择度、控制度）及建筑规范（如采光、结构可行性）。
加速预言机： 优化当前的图计算流程或训练代理模型以加速评估。
通用性扩展： 将该框架应用于 Transformer 或图神经网络等其他生成骨干网络。
人机协作： 结合人类设计师的反馈和下游工程约束，推动 AI 辅助住宅设计的实际落地。

总结： 该论文提出了一种创新的“空间句法引导后训练”范式，通过引入不可微的建筑学预言机，利用 PPO 强化学习高效地修正了扩散模型生成的住宅平面图，使其在保持几何精度的同时，显著提升了空间逻辑的合理性和功能分区的清晰度。