DART: Input-Difficulty-AwaRe Adaptive Threshold for Early-Exit DNNs

本文提出了 DART 框架,通过引入输入难度感知模块、联合退出策略优化算法及自适应系数管理系统,显著提升了早期退出深度神经网络在边缘设备上的推理速度与能效,同时提出了新的多目标评估指标 DAES 以全面衡量其性能优势。

Parth Patne, Mahdi Taheri, Christian Herglotz, Maksim Jenihhin, Milos Krstic, Michael Hübner

发布于 2026-03-16
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 DART 的新系统,它的核心任务是让人工智能(AI)在“边思考边做决定”时变得更聪明、更省电。

为了让你更容易理解,我们可以把现在的 AI 模型想象成一家超级繁忙的工厂,而 DART 就是这家工厂新引进的智能调度系统

1. 现状:以前的工厂是怎么运作的?(静态网络)

想象一下,以前这家工厂有一条长长的流水线。

  • 不管来的是什么订单(比如是简单的“画个圆圈”,还是复杂的“画一只正在跳舞的猫”),所有的产品都必须从头走到尾,经过每一道工序,直到最后才出结果。
  • 问题:这太浪费了!简单的订单其实只需要前几道工序就能搞定,但工厂却强迫它们跑完全程,导致机器过热、耗电巨大,而且排队时间很长。

2. 以前的改进方案:BranchyNet(早期的“提前下班”)

后来,工程师们想出了一个办法:在流水线的中间加几个“出口”。

  • 如果机器觉得“这个订单很简单,我已经很有把握了”,就允许它提前下班(提前退出),不用跑完剩下的工序。
  • 问题:以前的规则太死板了。比如,不管订单多难,只要机器自信度超过 80% 就放行。
    • 结果:有些很难的订单,机器其实还没想清楚,但因为自信度刚好到了 80%,就被“赶”出去了,导致出错
    • 或者,有些简单的订单,机器其实早就想好了,但因为规则没变,还得硬着头皮跑完,浪费能源

3. DART 的三大创新:智能调度系统

DART 就像是一个懂行情的超级调度员,它引入了三个新招数来解决上述问题:

第一招:给订单“体检”(输入难度感知)

在订单进入流水线之前,DART 会先快速扫一眼,判断这个订单有多难

  • 比喻:就像快递分拣员,看到包裹是轻飘飘的羽毛(简单图片),还是沉甸甸的石头(复杂图片)。
  • 做法:它不看内容细节(那样太慢),而是看图片的“纹理”、“边缘”和“变化”。
    • 如果是模糊、杂乱的图片,系统就知道:“哦,这个很难,得让 AI 多跑几道工序。”
    • 如果是清晰、简单的图片,系统就知道:“这个很简单,早点放行吧。”

第二招:动态调整“放行标准”(联合优化策略)

以前是“一刀切”的 80% 自信度就放行。DART 则是看人下菜碟

  • 比喻
    • 对于简单订单(体检显示容易):调度员会放宽标准,“只要你有 60% 把握,就可以提前下班!”(省时间)。
    • 对于困难订单(体检显示复杂):调度员会收紧标准,“你必须要有 95% 的把握才能走,否则必须继续加工!”(保质量)。
  • 做法:它用一种数学方法(动态规划)一次性算出所有出口的最佳标准,而不是一个个单独算,确保整体效率最高。

第三招:自我进化的“教练”(自适应系数管理)

系统不是一成不变的,它会边干边学

  • 比喻:就像教练在训练运动员。
    • 如果发现“画汽车”这个任务大家总是做对,教练就会说:“以后画汽车,标准可以更低点,早点放行。”
    • 如果发现“画轮船”这个任务大家老出错,教练就会说:“画轮船必须更谨慎,多跑几道工序。”
  • 做法:系统会实时记录每一类任务的完成情况,自动调整策略,适应环境的变化。

4. 实验结果:效果如何?

研究人员在几种经典的 AI 模型(像 AlexNet, ResNet 等)上测试了 DART:

  • 速度:最快提升了 3.3 倍(相当于以前跑 100 米要 10 秒,现在只要 3 秒)。
  • 省电:能耗降低了 5 倍 以上(相当于以前开大卡车运货,现在开小轿车)。
  • 准确率:虽然跑得快了,但准确率几乎没有下降,依然很准。

特别发现(关于 Transformer 模型):
当研究人员把这个系统用到一种叫"Vision Transformer"的新型 AI 模型上时,速度也快了,但准确率下降得比较多

  • 原因:这就像让一个擅长“看局部细节”的工人(CNN)去干“看整体结构”的活(Transformer),虽然也能干,但需要专门定制新的规则。这也提醒未来的研究需要针对这种新模型开发专门的“提前下班”规则。

5. 总结:DART 带来了什么?

DART 就像给 AI 装上了一个智能大脑,让它不再盲目地“死磕”到底。

  • 简单的任务:快速处理,省资源。
  • 复杂的任务:认真处理,保质量。
  • 最终效果:在边缘设备(比如手机、无人机、智能摄像头)上,AI 能跑得更快、更久、更省电,同时还能保持聪明。

这就好比我们平时走路:去楼下买瓶水(简单任务),我们直接走楼梯;去爬泰山(复杂任务),我们就会做好充分准备,慢慢走。DART 就是教会 AI 学会这种“看情况走路”的智慧。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →