StyleGallery: Training-free and Semantic-aware Personalized Style Transfer from Arbitrary Image References

StyleGallery 提出了一种无需训练且具备语义感知能力的个性化风格迁移框架,通过语义区域分割、聚类区域匹配及风格迁移优化三个核心阶段,有效解决了现有方法在语义对齐、额外约束依赖及全局 - 局部特征平衡方面的局限,实现了基于任意参考图像的高质量风格迁移。

Boyu He (College of Computer Science and Technology, National University of Defense Technology), Yunfan Ye (School of Design, Hunan University), Chang Liu (College of Computer Science and Technology, National University of Defense Technology), Weishang Wu (College of Computer Science and Technology, National University of Defense Technology), Fang Liu (School of Design, Hunan University), Zhiping Cai (College of Computer Science and Technology, National University of Defense Technology)2026-03-12💻 cs

Geometric Autoencoder for Diffusion Models

本文提出了一种名为几何自编码器(GAE)的框架,通过利用视觉基础模型构建优化的语义监督目标、采用潜变量归一化替代传统 KL 散度以及引入动态噪声采样机制,有效解决了现有潜在扩散模型在语义判别性、重建保真度与紧凑性之间的平衡难题,并在 ImageNet-1K 基准上实现了超越现有最先进方法的生成性能。

Hangyu Liu, Jianyong Wang, Yutao Sun2026-03-12💻 cs

Shape Control of a Planar Hyper-Redundant Robot via Hybrid Kinematics-Informed and Learning-based Approach

本文提出了一种名为 SpatioCoupledNet 的混合运动学信息与学习驱动的形状控制方法,通过分层神经网络架构和置信度门控机制,有效解决了柔性超冗余机器人因顺应性导致的稳定性问题,显著提升了其在复杂动态环境下的控制精度、收敛速度及抗干扰能力。

Yuli Song, Wenbo Li, Wenci Xin, Zhiqiang Tang, Daniela Rus, Cecilia Laschi2026-03-12💻 cs

Differentiable Geometric Indexing for End-to-End Generative Retrieval

该论文提出了一种名为可微分几何索引(DGI)的新方法,通过操作统一(利用 Gumbel-Softmax 和对称权重共享解决优化阻断)和等向几何优化(在单位超球面上使用缩放余弦相似度解决几何冲突),有效解决了生成式检索中索引构建与检索目标解耦及长尾项被热门项掩盖的问题,从而在大规模搜索和电商场景中实现了优于现有基线的性能。

Xujing Wang, Yufeng Chen, Boxuan Zhang, Jie Zhao, Chao Wei, Cai Xu, Ziyu Guan, Wei Zhao, Weiru Zhang, Xiaoyi Zeng2026-03-12💻 cs