Homogeneous and Heterogeneous Consistency progressive Re-ranking for Visible-Infrared Person Re-identification

该论文提出了一种包含异质与同质一致性重排序模块的渐进式模态关系重排序方法(HHCR)及其对应的基线网络(CRI),旨在通过同时解决跨模态差异和模态内变化来提升可见光 - 红外行人重识别的性能,并在实验中取得了最先进的效果。

Yiming Wang

发布于 2026-03-18
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲的是如何解决一个非常棘手的“找人”难题:如何在白天(可见光)和晚上(红外热成像)两种完全不同的环境下,认出同一个人?

想象一下,你是一名侦探,手里有一张嫌疑人在白天穿着花衬衫的照片(可见光),现在你要在一堆监控录像里找到他。但这堆录像里,一半是白天的,另一半是晚上用热成像仪拍的(红外)。

难点在哪里?
白天照片里,你能看到衣服的颜色、花纹;晚上热成像里,你只能看到一个人形轮廓和体温,衣服花纹全没了。这就好比让你把“穿花衬衫的张三”和“一团发热的张三”认成同一个人,非常困难。

现有的老方法就像是一个只会看“大轮廓”的助手,它要么只擅长比对白天照片,要么只擅长比对晚上照片,很难同时处理这两种截然不同的信息,导致经常认错人。


这篇论文提出了什么新招?

作者发明了一套名为 HHCR(同质与异质一致性重排序) 的“超级侦探助手”,并配套了一个叫 CRI 的“推理大脑”。

我们可以把这套系统比作一个两阶段的“相亲匹配”过程

第一阶段:跨模态“找对象”(异质一致性重排序)

  • 比喻:想象你在一个巨大的舞池里,左边站着一群穿白天的衣服的人,右边站着一群穿红外热成像衣服的人。因为两边人数不一样多(白天人多,晚上人少),直接配对很难。
  • 怎么做:这个助手先不管细节,先通过一种特殊的“图神经网络”(可以理解为一种高级的社交关系网),把白天和晚上的人强行拉到一个关系网里。它会把白天最像的几个人和晚上最像的几个人先圈在一起,形成一个临时的“候选圈”。
  • 目的:解决“白天和晚上长得完全不一样”的问题,先把大方向找对,把那些明显不是同一个人的排除掉。

第二阶段:同模态“对暗号”(同质一致性重排序)

  • 比喻:现在候选圈里的人虽然大方向对了,但可能混进了一些“捣乱分子”(比如两个长得像的陌生人,或者照片模糊导致的误判)。这时候,助手开始让“白天的人”只和“白天的人”比,让“晚上的人”只和“晚上的人”比。
  • 怎么做:它会在白天的人群里,把长得特别像的几个人聚在一起,互相确认“暗号”;晚上的人群也这么做。通过这种“同类互证”,把那些混进来的“捣乱分子”(噪声)踢出去。
  • 目的:解决“照片模糊、光线不好”导致的细节丢失问题,确保留下的都是真正的“自己人”。

最终结果:加权打分

最后,助手把“跨模态找对象”的结果和“同模态对暗号”的结果结合起来,算出一个最终的相似度分数。分数最高的,就是我们要找的人。


为什么这个方法很厉害?

  1. 双管齐下:以前的方法要么只看白天,要么只看晚上,或者只简单地把两者混在一起。这个方法像是一个既懂白天又懂晚上,还能让两边互相验证的超级专家。
  2. 去噪能力强:就像在嘈杂的派对上,它不仅能听清谁在喊你的名字(跨模态),还能通过周围朋友的确认(同模态),排除掉那些喊错名字的人。
  3. 实战效果好:作者在三个著名的“找人”数据集(SYSU-MM01, RegDB, LLCM)上进行了测试。结果发现,用了这个新方法后,找对人的准确率(Rank-1)和综合评分(mAP)都达到了世界顶尖水平(State-of-the-Art)

总结

简单来说,这篇论文就是给“夜间找人”技术装上了一双慧眼一个逻辑严密的头脑。它不再死板地比对像素,而是通过先找大关系(异质),再抠小细节(同质) 的两步走策略,成功解决了白天和晚上照片“画风”不同导致的认人难题。

这就好比以前我们是用“肉眼”在雾里找人,现在是用“雷达 + 人脸识别 + 逻辑推理”的组合拳,不管白天黑夜,都能把目标锁定得死死的。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →