Does FLUX Already Know How to Perform Physically Plausible Image Composition?

该论文提出了无需训练的 SHINE 框架,利用预训练扩散模型(如 FLUX)内在的物理先验,通过流形引导锚定损失和自适应背景融合等技术,实现了在复杂光照与高分辨率场景下物理真实且无缝的图像合成,并发布了包含多样化挑战条件的 ComplexCompo 基准数据集以验证其优越性能。

Shilin Lu, Zhuming Lian, Zihan Zhou + 3 more2026-03-03🤖 cs.AI

CircuitSense: A Hierarchical MLLM Benchmark Bridging Visual Comprehension and Symbolic Reasoning in Engineering Design Process

本文提出了名为 CircuitSense 的层次化多模态大模型基准,通过涵盖 8000 多个从感知到设计的全流程电路问题,揭示了当前先进模型在视觉识别任务上表现优异但在从电路图推导符号方程等数学推理能力上存在显著短板,从而确立了符号推理作为评估工程智能核心指标的重要性。

Arman Akbari, Jian Gao, Yifei Zou + 6 more2026-03-03💻 cs

Splat the Net: Radiance Fields with Splattable Neural Primitives

该论文提出了“可泼洒神经基元”(Splattable Neural Primitives)这一新型体素表示法,通过将有界神经密度场编码为浅层神经网络,实现了无需射线追踪的精确解析积分,从而在保持与 3D 高斯泼洒(3D Gaussian Splatting)相当的高质量与新视角合成速度的同时,将所需基元数量减少了 10 倍、参数量减少了 6 倍。

Xilong Zhou, Bao-Huy Nguyen, Loïc Magne + 3 more2026-03-03💻 cs

LinearSR: Unlocking Linear Attention for Stable and Efficient Image Super-Resolution

本文提出了名为 LinearSR 的框架,通过创新性的 ESGF 训练策略、基于信噪比的混合专家架构以及轻量级 TAG 引导范式,首次系统性地解决了线性注意力机制在真实感图像超分辨率中面临的训练不稳定与感知 - 失真权衡难题,实现了兼具卓越感知质量与高效推理速度的生成式超分辨率模型。

Xiaohui Li, Shaobin Zhuang, Shuo Cao + 6 more2026-03-03💻 cs