STMI: Segmentation-Guided Token Modulation with Cross-Modal Hypergraph Interaction for Multi-Modal Object Re-Identification

本文提出了一种名为 STMI 的新型多模态行人重识别框架,通过结合利用 SAM 掩码的分割引导特征调制、基于可学习查询的语义令牌重分配以及跨模态超图交互机制,有效解决了现有方法中因硬令牌过滤或简单融合导致的判别性线索丢失及背景干扰问题,并在多个基准测试中展现了卓越的性能与鲁棒性。

Xingguo Xu, Zhanyu Liu, Weixiang Zhou + 5 more2026-03-03💻 cs

NERFIFY: A Multi-Agent Framework for Turning NeRF Papers into Code

NERFIFY 是一个多智能体框架,它通过结合上下文无关文法约束、图式思维代码合成、引用组件自动集成及视觉反馈等六项创新,成功将复杂的 NeRF 论文转化为可训练的 Nerfstudio 插件,在无需公开代码的情况下实现了与专家手写代码相当的视觉质量,并将复现时间从数周缩短至数分钟。

Seemandhar Jain, Keshav Gupta, Kunal Gupta + 1 more2026-03-03💻 cs