Multi-View In-Cabin Monitoring System for Public Transport Vehicles

本文介绍了一个用于公共交通工具的多视角座舱监控数据集,该数据集具有带有 3D 注释的同步 RGB 和深度图像,以及用于评估多视角 3D 检测模型的标定流水线和基准测试工具。

原作者: Evgeny Gorelik, Kenny Dean Karrow, Fikret Sivrikaya, Sahin Albayrak, Christian Baumann

发布于 2026-06-11✓ Author reviewed
📖 1 分钟阅读☕ 轻松阅读

原作者: Evgeny Gorelik, Kenny Dean Karrow, Fikret Sivrikaya, Sahin Albayrak, Christian Baumann

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一辆拥挤的城市公交车,就像是一个移动的、拥挤的起居室。通常情况下,如果你想准确知道每个人坐在哪里、站在哪里或在如何移动,你需要一个由人在各个角度拿着剪贴板观察的团队。但在自动驾驶公交车的世界里,我们需要计算机来自动完成这项工作。

这篇论文介绍了一个为这些“计算机大脑”设计的全新“培训学校”。以下是研究人员构建的内容及其实现方式的拆解,使用了简单的类比:

1. 问题所在:“盲区”公交车

大多数自动驾驶技术就像是一辆眼睛盯着窗外看路况的汽车。但公交车内部发生的情况又如何呢?

  • 挑战: 在公交车内,人与人之间会互相遮挡(遮挡现象),座椅具有反射性,且摄像头通常只能看到房间的一个微小切片。如果只有一个摄像头,就像试图通过观察单个座位上的单帧画面来理解整部电影一样——你会错过一半的动作。
  • 差距: 此前并没有一个好的“教科书”(数据集),拥有足够的案例(从多个角度观察公交车内的乘客)来教会计算机清晰地观察。

2. 解决方案:拥有“超视觉”的“智能公交车”

研究团队在德国建造了一辆配备了“超视觉”系统的特殊数字化城市公交车。

  • 眼睛: 他们安装了四台摄像头向内观察(就像站在房间角落的保安),以及一个旋转激光扫描仪(LiDAR),它像蝙蝠利用回声定位一样,用于绘制房间的 3D 地图。
  • 数据: 他们记录了超过 9,000 个传感器同步工作的瞬间。这就像是一部 4D 电影,你可以同时从四个角度观察房间,外加一个 3D 深度图。

3. 魔法技巧:教计算机在“没有老师”的情况下“看见”

通常,为了教计算机识别一个人,人类需要在成千上万张照片中手动画出方框。这非常耗时。

  • 流水线: 研究人员没有手动画每一个方框,而是创建了一个“机器人助手”流水线:
    1. 侦探: 他们使用一种 AI 在视频中寻找人。
    2. 3D 雕塑家: 他们使用另一种 AI,仅根据 2D 摄像头图像来推测人体 3D 形状。
    3. 裁判: 由于四台摄像头看到的同一个人的方式可能略有不同,他们构建了一个充当裁判的系统。它获取四个不同的预测结果,进行比较,并选出最准确的“平均”3D 位置。
    4. 结果: 他们最终得到了一个数据集,其中每个人都有精确的 3D “骨架”和 3D 方框,而这些都是在几乎不需要人工干预的情况下自动生成的。

4. 测试:计算机能学会吗?

研究人员不仅制作了数据,还测试了现有的“计算机大脑”是否能从中学习。

  • 考试: 他们采用了著名的 AI 模型(如 “Lift-Splat-Shoot” 和 “BEVFusion”),并尝试利用这些新数据来教它们识别公交车内的人。
  • 得分: 这些模型表现得相当不错,特别是在允许一定误差范围的情况下。然而,测试也表明,仅观察单一摄像头的视角是有风险的(取决于角度,会漏掉约 19% 到 60% 的人),这证明了你确实需要多个摄像头才能获得全貌。

5. 盒子里有什么?

研究人员将整个包免费提供给其他科学家。它包括:

  • 视频和激光数据。
  • 用于生成 3D 标签的“机器人助手”工具。
  • 符合标准自动驾驶软件(nuScenes 格式)的格式。

总结

你可以将这篇论文看作是为自动驾驶公交车建造的一个高科技训练场。在此之前,公交车试图用一只模糊的眼睛来观察车厢内部。现在,它们拥有了四台高清摄像头、一个 3D 激光扫描仪,以及一套“评分完美”的练习题(数据集),用来学习如何追踪乘客,即使他们在座椅后躲藏或拥挤在一起。

他们明确没有做的事:
本文严格专注于检测人在哪里以及他们在做什么(坐着、站着、行走)。他们还没有在真实的交通行驶中的公交车上测试该系统,也没有声称该系统目前可以解决医疗紧急情况或取代人类驾驶员。这是一个面向未来研究的基础性工具。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →