Benchmarking Deep Learning Models for Object Detection on Edge Computing Devices

本文在各类边缘设备上对最先进目标检测模型进行了基准测试,以分析精度、推理速度与能效之间的权衡,从而为实时应用中选择最佳模型与设备组合提供实用指导。

原作者: Daghash K. Alqahtani, Aamir Cheema, Adel N. Toosi

发布于 2026-05-01
📖 1 分钟阅读☕ 轻松阅读

这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

想象一下,你正在为一家小商店搭建一套安防摄像头系统,但你无法将其连接到庞大且昂贵的云服务器。相反,你需要摄像头利用一台微小的、电池供电的计算机,在现场“思考”并识别入侵者。这就是边缘计算的世界:在本地完成繁重的计算任务,而不是将数据发送到云端。

这篇论文就像是一篇微型计算机的“汽车评测”,只不过作者测试的不是它们的行驶速度,而是它们使用不同类型的 AI 软件“看”和识别物体(如人、车或动物)的能力。

以下是他们实验的通俗拆解:

竞争者:“大脑”(AI 模型)

研究人员测试了三类不同的 AI“大脑”,它们专为识别物体而设计。可以将它们想象成不同类型的侦探:

  1. YOLOv8(You Only Look Once,即“你只看一次”): 这些是高绩效侦探。
    • “中等”版本: 一位资深侦探,极其准确,但思考时间长,且很快会感到疲惫(消耗大量电池)。
    • “纳米”和“小型”版本: 初级侦探,速度更快,能耗更低,但可能会遗漏一些细节。
  2. SSD(Single Shot Detector,单次检测器): 这些是短跑运动员。
    • 它们速度极快且能耗极低,但在识别棘手或微小物体方面表现不佳。它们就像一名进行快速巡逻的保安,但可能会漏掉狡猾的小偷。
  3. EfficientDet Lite: 这些是平衡型侦探。它们试图在速度和准确性之间找到中间地带。

赛道:“肌肉”(边缘设备)

作者将这些侦探在不同的微型计算机上进行了测试,这些计算机充当了“大脑”的躯体:

  • 树莓派(Raspberry Pi,型号 3、4 和 5): 它们是计算界的“瑞士军刀”。它们便宜、小巧且广受欢迎。作者既测试了它们独立运行的情况,也测试了它们连接特殊 USB 棒(称为TPU)的情况,该 USB 棒充当涡轮增压器,帮助它们思考得更快。
  • NVIDIA Jetson Orin Nano: 这是团队中的“跑车”。它更昂贵、更强大,专为繁重的 AI 任务而设计。

比赛结果:速度、电池和准确性

研究人员进行了一场马拉松式的测试,要求每台计算机在数千张照片中识别物体。他们测量了三项指标:

  1. 识别物体所需的时间(推理时间)。
  2. 每张照片消耗的电量(能耗)。
  3. 实际正确识别出的物体数量(准确性/mAP)。

以下是他们的发现:

  • “快速且节俭”的冠军: SSD 模型在速度和电池寿命方面是明确的赢家。它们就像一名吃得很少且跑得快的马拉松选手,但它们并非最擅长识别每一个细节。
  • “准确但耗能”的冠军: YOLOv8 中等 模型是最准确的侦探,正确识别出的物体最多。然而,它速度慢且消耗大量电池,就像一辆油耗很高的豪华车。
  • “涡轮增压器”效应: 当他们在树莓派上添加 TPU 加速器(USB 棒)时,就像给自行车装上了喷气发动机。
    • 对于 SSDEfficientDet 模型,TPU 使它们变得极其快速且高效,同时没有损害其准确性。
    • 然而,对于 YOLOv8 模型,TPU 迫使它们缩小“大脑”(压缩模型)以适应。这使它们变得更快,但准确性降低了,就像一位资深侦探为了跑得更快而被迫戴上眼罩。
  • “跑车”冠军: Jetson Orin Nano 是总冠军。对于重型 YOLOv8 模型,它是最快且最节能的。它能够处理庞大且准确的模型,而不会导致速度减慢或电池过快耗尽。

核心启示

没有单一的“完美”选择。这取决于你的需求:

  • 如果你需要最大的速度和电池寿命(例如需要飞行数小时的无人机),你应该选择 带有 TPU 的树莓派 上的 SSD 模型
  • 如果你需要最高的准确性(例如必须看到每个行人的自动驾驶汽车),并且拥有强大的设备,那么运行 YOLOv8Jetson Orin Nano 是最佳选择。
  • 如果你预算有限且需要平衡,那么搭载 EfficientDet树莓派 4 或 5 是一个稳固的中间选择。

简而言之,这篇论文告诉我们,构建智能的本地 AI 是一项平衡艺术。你必须在计算机的速度、它能节省的电量以及它需要具备的聪明程度之间做出选择。天下没有免费的午餐,但了解这些权衡有助于你为特定的工作构建正确的系统。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →