Optimizing Split Learning Latency in TinyML-Based IoT Systems

本文首次呈现了基于 TinyML 的分割学习在 ESP32-S3 开发板上的实验延迟基准测试,结果表明,所提出的基于束搜索的算法利用 ESP-NOW 协议,通过优化不同模型和通信协议下的分割点,有效降低了端到端推理延迟。

原作者: Zied Jenhani, Mounir Bensalem, Jasenka Dizdarević, Admela Jukan

发布于 2026-05-07
📖 1 分钟阅读☕ 轻松阅读

原作者: Zied Jenhani, Mounir Bensalem, Jasenka Dizdarević, Admela Jukan

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

想象一下,你有一个非常聪明但体型极小的机器人(就像门铃上的智能摄像头),它需要解决一个复杂的谜题,例如识别人脸。问题在于,这个机器人体积小、电池微小、算力有限。如果你让它独自解决整个谜题,要么耗时极长,要么可能在完成前就耗尽电量。

本文探讨了一种巧妙的变通方法,称为分割学习(Split Learning)。与其让这个小机器人包揽所有工作,不如将任务一分为二。小机器人完成谜题中简单的前半部分,然后将其发现的“线索”发送给附近更大、更强的机器人(例如智能音箱或本地服务器)。大机器人完成谜题中困难的后半部分,并将答案喊回。

本文作者旨在找出利用真实低功耗硬件(具体为 ESP32-S3 开发板,这是一种廉价、开源的微控制器)进行这种“喊话与聆听”游戏的最快方式

以下是他们研究发现的简要说明,辅以简单的类比:

1. “喊话”问题:选择合适的协议

当小机器人将线索发送给大机器人时,它必须选择一种“语言”或“传输方式”来发送数据。研究人员测试了四种不同的方法,就像在不同类型的邮政服务之间进行选择:

  • UDP:就像寄明信片。它非常快,因为你不需要等待回执,但如果卡片丢失,你便无从知晓。
  • TCP:就像寄挂号信。它非常可靠(你会收到回执),但由于发送信件前需要处理大量的“握手”手续,因此耗时更长。
  • BLE(蓝牙):就像一部缓慢且话多的对讲机。它连接良好,但建立对话需要很长时间,且数据以非常小且碎片化的块发送。
  • ESP-NOW:就像一部专用的、高速的对讲机,无需先建立正式连接。它直接将消息广播出去。

获胜者:令人惊讶的是,ESP-NOW 整体速度最快。尽管它有较小的“信封”大小限制(无法一次性携带巨大的数据块),但它通过跳过正式的连接设置节省了如此多的时间,从而超越了其他选项。它完成往返(发送线索并收到答案)大约需要 3.6 秒,而蓝牙则耗时超过 10 秒。

2. “切割”问题:在哪里分割任务?

研究人员还必须决定确切在哪里切割谜题。

  • 切割过早:小机器人几乎不做任何工作,但它必须向大机器人发送一大堆线索。这会堵塞网络。
  • 切割过晚:小机器人几乎完成了所有工作,这对于它弱小的算力来说耗时太长。

他们在两个流行的 AI 模型(MobileNet-V2 和 ResNet50)中测试了不同的“切割点”。他们发现,最佳的切割位置取决于模型和网络,但总体而言,他们希望找到“金发姑娘”区域,即小机器人完成足够的工作,同时又不会使网络不堪重负。

3. “智能规划师”:束搜索(Beam Search)

寻找完美的切割点,就像试图在迷宫中找到最佳路线。

  • 暴力搜索:尝试每一条可能的路径。这能保证找到最佳路线,但计算起来耗时极长(需要数天)。
  • 贪婪搜索:选择第一条看起来不错的路径。它很快,但你可能会在后来陷入死胡同。
  • 束搜索(获胜者):想象你在探索迷宫,但不是检查每一条路径,而是在任何给定时刻只保留前 3 条最有希望的路径。如果某条路径看起来不好,你就放弃它;如果某条路径看起来不错,你就保留它并继续探索。

研究人员利用这种束搜索方法创建了一种算法。

  • 结果:它几乎瞬间(对于一组 5 个设备,大约 0.1 秒)就找到了一条近乎完美的路线。
  • 意义:它足够快,可用于实时系统,而“暴力搜索”方法计算同样的内容则需要数小时甚至数天。

“食谱”总结

本文最后总结了一个让这些小型物联网设备高效协同工作的简单“食谱”:

  1. 使用 ESP-NOW 进行通信,因为它跳过了无聊的设置步骤,且往返速度最快。
  2. 使用束搜索算法 自动决定在哪里分割 AI 模型。这确保了小机器人和大机器人以最节省时间的方式分担工作。

通过将正确的“喊话方法”(ESP-NOW)与智能的“规划师”(束搜索)相结合,他们成功让这些小型低功耗设备比以前更快地解决复杂的 AI 谜题,而无需升级硬件。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →