(PASS) Visual Prompt Locates Good Structure Sparsity through a Recurrent HyperNetwork

本文提出了名为 PASS 的循环超网络框架,通过结合视觉提示与网络权重统计来捕捉通道重要性,从而在多种架构和数据集上实现了优于现有方法的结构性剪枝效果。

Tianjin Huang, Fang Meng, Li Shen, Fan Liu, Yulong Pei, Mykola Pechenizkiy, Shiwei Liu, Tianlong Chen

发布于 2026-02-24
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 PASS 的新方法,它的核心任务可以比作是给庞大的神经网络做“瘦身手术”,而且是用一种非常聪明的“视觉提示”来指导手术刀下在哪里。

为了让你轻松理解,我们可以把整个过程想象成装修一间巨大的、堆满杂物的仓库(也就是大型神经网络)

1. 背景:为什么要“瘦身”?

现在的 AI 模型(比如能看图说话的超级大脑)非常强大,但它们太“胖”了。

  • 问题:它们需要巨大的电量和昂贵的硬件才能运行,就像一辆大卡车,虽然能拉很多货,但普通的小路(手机、小电脑)根本走不了。
  • 传统做法:以前的“瘦身”方法(模型剪枝)就像是让装修工凭经验或简单的规则(比如“把最轻的箱子扔掉”)来清理仓库。但这往往不够精准,扔了不该扔的,或者没扔够,导致仓库还是很大,或者里面的货物(数据)乱了。

2. 核心创新:PASS 是什么?

PASS 就像是一位拥有“透视眼”和“记忆”的超级装修设计师。它有两个绝招:

绝招一:视觉提示(Visual Prompt)—— 给设计师一张“寻宝图”

以前,设计师只看仓库里的箱子(模型权重)来决定扔什么。

  • PASS 的做法:它在给设计师看箱子之前,先给一张特殊的“寻宝图”(视觉提示)。这张图不是普通的图,而是一张经过精心设计的“提示图”。
  • 比喻:这就好比你要整理书架,以前你只看书厚不厚来决定扔哪本。现在,有人在你耳边说:“注意!那些红色的书里藏着关键信息,千万别扔!”或者“把那些看起来像过期的杂志先挑出来”。这张“提示图”帮助设计师更敏锐地识别出哪些通道(书架上的格子)是真正重要的。

绝招二:循环超网络(Recurrent HyperNetwork)—— 像“传话游戏”一样思考

神经网络有很多层,就像仓库有很多排货架。

  • 传统做法:设计师是“一根筋”地看每一排货架,完全不管上一排货架被清理成什么样了。这导致可能上一排把关键通道堵死了,下一排还在拼命保留没用的东西。
  • PASS 的做法:它使用了一种**“循环记忆”**机制(LSTM)。
  • 比喻:想象装修工在清理第一排货架时,会告诉第二排的同事:“嘿,第一排我留了左边三个格子,所以第二排你最好也配合一下,保留左边的通道,这样货物才能顺畅流动。”
    • 这种**“层层递进、互相商量”**的方式,确保了清理后的仓库(稀疏模型)依然是一个通畅的整体,货物(数据)能顺利从入口运到出口。

3. 它是如何工作的?(PASS 的三步走)

  1. 输入:把“寻宝图”(视觉提示)和“仓库现状”(模型权重)一起交给超级设计师(PASS 超网络)。
  2. 思考:设计师利用“记忆”(上一层的清理结果)和“提示”(视觉图),一层一层地决定:“这一层,保留哪些格子,扔掉哪些格子?”
  3. 输出:生成一张完美的“清理清单”(稀疏掩码),告诉电脑哪些部分可以删掉,哪些必须保留。

4. 效果怎么样?

论文通过大量的实验(在 6 个不同的数据集和 4 种不同的模型架构上测试)证明了 PASS 的厉害之处:

  • 更瘦更壮:在保持同样运行速度(FLOPs)的情况下,PASS 清理后的模型准确率比传统方法高出 1% 到 3%
  • 更快更省:如果要达到同样的准确率,PASS 清理后的模型运行速度比传统方法快了 0.35 倍(也就是更省电、更流畅)。
  • 举一反三:最神奇的是,PASS 学会的“清理规则”和“寻宝图”可以迁移。比如在“食物识别”任务上学到的清理经验,直接用到“汽车识别”任务上,效果依然很好。这说明它学到的不是死记硬背,而是真正的“整理智慧”。

总结

简单来说,PASS 就是给 AI 模型瘦身时,不再盲目地砍,而是:

  1. 给设计师一张特殊的提示图(视觉提示),让它看得更准;
  2. 让设计师层层沟通(循环机制),保证砍完之后结构依然稳固。

这种方法让 AI 模型变得更小、更快,同时还能保持甚至提升它的聪明程度,是未来让 AI 在手机、汽车等小设备上流畅运行的关键技术之一。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →