Towards Camera Open-set 3D Object Detection for Autonomous Driving Scenarios

本文提出了名为 OS-Det3D 的两阶段训练框架,通过结合 LiDAR 几何线索生成类无关 3D 提案并利用联合选择模块进行筛选,有效解决了自动驾驶场景中相机 3D 检测器难以识别未知物体的问题,同时提升了对已知物体的检测性能。

Zhuolin He, Xinrun Li, Jiacheng Tang, Shoumeng Qiu, Wenfu Wang, Xiangyang Xue, Jian Pu

发布于 2026-03-03
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这是一篇关于自动驾驶汽车如何“看见”并识别路上从未见过的奇怪物体的论文。

为了让你轻松理解,我们可以把自动驾驶汽车想象成一个刚毕业的交通协管员,而这篇论文提出的 OS-Det3D 系统,就是给这位协管员配备的一套超级“直觉”训练法

🚗 背景:为什么现在的自动驾驶会“翻车”?

想象一下,你教一个学生认路。你给他看了一堆照片,告诉他:“这是汽车(红色),这是行人(蓝色),这是自行车(绿色)。”

  • 传统方法(闭集检测): 这个学生非常听话,但他只认识你教过的这三样东西。如果路上突然跑出来一只长颈鹿,或者一个巨大的充气玩偶,或者一堆奇怪的垃圾,他会直接无视,或者错误地把它当成“汽车”或“行人”。
  • 现实风险: 在真实的道路上,情况千变万化。如果自动驾驶汽车认不出这些“新面孔”,就可能会发生危险。

💡 核心方案:OS-Det3D(两步走训练法)

这篇论文提出了一种新的训练框架,叫 OS-Det3D。它不像以前那样只教学生认“已知物品”,而是分两步走,教学生学会“发现未知”。

第一步:让“雷达”当老师,找出所有“像物体”的东西

(3D 物体发现网络 ODN3D)

  • 问题: 如果只让摄像头(眼睛)去猜,它很容易被骗。比如,它可能把墙上的海报当成车,因为海报上有车轮的图案(纹理)。
  • 解决: 我们引入一个激光雷达(LiDAR)作为“几何老师”。激光雷达不靠颜色或图案,它靠形状和距离(就像用手摸东西)。
  • 比喻: 想象你在一个黑屋子里,你看不见东西,但你伸出手去摸。不管摸到的是猫、狗还是椅子,只要它是立体的、有形状的,你就知道“这里有个东西”。
  • 操作: 这个系统利用激光雷达的几何信息,不管那个东西叫什么名字,只要它看起来像个物体,就给它发一张“入场券”(生成候选框),并给它打一个**“像不像物体”的分数(Objectness Score)**。
    • 注意: 这时候它还不知道那是什么,只知道“那里有个东西”。

第二步:让“摄像头”当裁判,筛选出真正的“新面孔”

(联合选择模块 JS)

  • 问题: 第一步找出来的东西太多了,里面混杂着很多噪音(比如树影、路面的反光),甚至可能把已知的车也混进去了。我们需要把真正的“新面孔”挑出来。
  • 解决: 我们让**摄像头(眼睛)第一步的“像物体分数”**联手。
  • 比喻: 这是一个**“排雷”游戏**。
    • 摄像头说:“这个东西看起来很像我们以前见过的‘卡车’或‘行人’。”(如果很像,说明它是已知的,或者只是长得像已知的,排除)。
    • 第一步的分数说:“这个东西在三维空间里确实是个立体的物体!”(确认它是物体)。
    • 联合判断: 如果一个东西**“确实是立体的物体”(高分),但是“摄像头觉得它长得不像任何已知的车或人”**(低相似度),那么!🎉 这就是我们要找的“新面孔”(未知物体)!
  • 结果: 系统把这些挑出来的“新面孔”当作**“假想真值”(Pseudo Ground Truth)**,反过来再教摄像头:“看,这就是未知物体,下次见到类似的要认出来!”

🌟 这个系统厉害在哪里?

  1. 不再“瞎眼”: 以前摄像头只能认死记硬背的东西,现在它能发现路上的垃圾、奇怪的障碍物、没见过的动物等。
  2. 越练越聪明: 它利用激光雷达的“形状直觉”来辅助摄像头,让摄像头也能学会识别未知物体,而不仅仅依赖激光雷达(因为激光雷达太贵,很多车只有摄像头)。
  3. 双向提升: 实验证明,这套方法不仅让汽车能认出“新东西”,连以前认识的“老熟人”(已知车辆)也认得更准了。

📝 总结

这就好比给自动驾驶汽车装上了一个**“好奇心”**。

  • 以前的车: “我只认识红车、蓝人和绿自行车。别的我不看。”
  • 现在的车(OS-Det3D): “虽然我不认识那个绿色的、长得像大象的物体,但我知道它是个立体的、挡路的家伙,而且它肯定不是车或人。我要小心它!"

这篇论文就是教自动驾驶汽车如何从“死记硬背”进化到“举一反三”,从而在复杂的现实世界中更安全地行驶。