IdGlow: Dynamic Identity Modulation for Multi-Subject Generation

本文提出了 IdGlow,一种基于流匹配扩散模型的无掩码两阶段框架,通过任务自适应时间步调度、基于坏例的视觉语言模型提示合成以及细粒度组级直接偏好优化,有效解决了多主体生成中的稳定性 - 可塑性困境,在保持高保真身份特征的同时实现了自然和谐的场景融合与年龄变换。

Honghao Cai, Xiangyuan Wang, Yunhao Bai + 10 more2026-03-03🤖 cs.AI

Linking Modality Isolation in Heterogeneous Collaborative Perception

本文针对异构协同感知中因训练数据缺失共现样本而导致的模态隔离难题,提出了首个无需共现监督的高效对齐框架 CodeAlign,该方法通过跨模态特征 - 码本 - 特征(FCF)翻译机制实现模态对齐,在显著降低参数量与通信开销的同时,在 OPV2V 和 DAIR-V2X 数据集上取得了最先进的感知性能。

Changxing Liu, Zichen Chao, Siheng Chen2026-03-03💻 cs

Exploring Spatiotemporal Feature Propagation for Video-Level Compressive Spectral Reconstruction: Dataset, Model and Benchmark

本文针对现有光谱压缩成像方法在单帧重建不确定性及视频时序一致性方面的局限,构建了首个动态高光谱数据集 DynaSpec,提出了利用时空特征传播的 PG-SVRT 模型,并通过仿真与实物实验验证了其在重建质量、光谱保真度及时序一致性上的优越性能。

Lijing Cai, Zhan Shi, Chenglong Huang + 6 more2026-03-03💻 cs

STMI: Segmentation-Guided Token Modulation with Cross-Modal Hypergraph Interaction for Multi-Modal Object Re-Identification

本文提出了一种名为 STMI 的新型多模态行人重识别框架,通过结合利用 SAM 掩码的分割引导特征调制、基于可学习查询的语义令牌重分配以及跨模态超图交互机制,有效解决了现有方法中因硬令牌过滤或简单融合导致的判别性线索丢失及背景干扰问题,并在多个基准测试中展现了卓越的性能与鲁棒性。

Xingguo Xu, Zhanyu Liu, Weixiang Zhou + 5 more2026-03-03💻 cs