CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

本文提出了 CLAD-Net 框架,通过结合自监督 Transformer 作为长期记忆与基于知识蒸馏的监督 CNN,有效解决了多传感器可穿戴系统在跨主体连续学习中的灾难性遗忘问题,并在标签稀缺场景下实现了高精度且低遗忘的活动识别。

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh

发布于 2026-03-10
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇文章介绍了一种名为 CLAD-Net 的新人工智能系统,它的核心任务是**“如何让人工智能在不断学习新人的同时,不忘记旧人的习惯”**。

为了让你轻松理解,我们可以把这个人机互动的过程想象成一位“超级健康管家”的学习过程

1. 背景:管家遇到的“健忘”难题

想象一下,你雇佣了一位非常聪明的健康管家(AI 模型),他的工作是监测你的运动(比如走路、跑步、睡觉)。

  • 理想情况:管家认识你,知道你的走路姿势。
  • 现实挑战:现在,管家需要认识你的家人、朋友,甚至社区里的其他人。每个人的走路姿势、身高、步幅都不同(这就是数据分布的“变化”)。

问题出在哪?
传统的 AI 就像一个**“死记硬背但记性不好”的学生**。当管家开始学习“爸爸”的走路姿势时,为了适应新数据,他的大脑会覆盖掉之前关于“你”的记忆。

  • 结果:管家能认出爸爸了,但把你认成了别人,或者完全忘了怎么识别你的动作。
  • 学术术语:这叫**“灾难性遗忘” (Catastrophic Forgetting)**。
  • 隐私困境:通常,为了不让管家忘事,我们会把以前所有人的录像都存下来反复看(这叫“回放”)。但在医疗领域,保存每个人的原始运动数据是违法的(隐私泄露),而且设备内存也不够。

2. 解决方案:CLAD-Net 的“双脑”策略

为了解决这个问题,作者设计了一个叫 CLAD-Net 的系统。它不像普通 AI 只有一个大脑,而是模仿人类,拥有两个互补的“记忆系统”

🧠 系统一:长期记忆库(自监督 Transformer)

  • 角色:一位**“观察力敏锐的哲学家”**。
  • 工作方式:这位哲学家不需要标签(不需要人告诉他“这是走路”还是“这是跑步”)。他只看原始数据,通过观察不同身体部位(手、脚、胸)传感器数据之间的相互关系来学习。
  • 比喻:就像婴儿学说话,他不需要字典,而是通过听声音的规律、节奏和上下文,自己总结出“语言”的通用结构。
  • 作用:他学会了**“通用的运动规律”。比如,无论谁在走路,手臂和腿的摆动都有某种内在联系。这部分记忆非常稳固,不会因为换了个人就崩塌。它充当了系统的“长期记忆”**。

🧠 系统二:短期分类器(监督 CNN + 知识蒸馏)

  • 角色:一位**“经验丰富的教练”**。
  • 工作方式:这位教练负责具体的分类任务(告诉系统“这是张三在跑步”)。但他有一个特殊技能:“知识蒸馏”
  • 比喻:想象教练在教新学生(新病人)时,手里拿着一份**“旧学生的笔记”**(之前训练好的模型参数)。他一边教新课,一边时刻对照旧笔记,确保自己教新内容时,不会把旧笔记里的核心知识点给改错了
  • 作用:这就像在盖新房时,小心翼翼地保留旧房子的地基。它保证了系统在适应新人的同时,不会忘记旧人的特征

3. 核心创新:为什么它这么强?

CLAD-Net 的厉害之处在于它把这两个系统结合起来了:

  1. 不用存录像(隐私保护):它不需要把以前所有人的原始数据存下来(不像其他方法需要“回放”旧录像)。它只保留了“学到的规律”和“旧模型的参数快照”。这对医疗隐私至关重要。
  2. 少标签也能学(半监督):在现实生活中,病人很少会乖乖给每个动作都贴上标签(比如“我现在在走路”)。CLAD-Net 的“哲学家”部分可以利用大量没有标签的数据来学习通用规律,所以即使标签很少,它也能学得很好。
  3. 跨身体部位的“跨注意力”:它的“哲学家”特别擅长观察不同身体部位(手、脚、胸)之间的互动。就像看舞蹈,不仅看脚怎么跳,还要看手怎么配合。这种全局视角让它更能理解运动的本质,而不是死记硬背某个人的动作。

4. 实验结果:它表现如何?

作者在三个著名的运动数据集上测试了这个系统,结果非常亮眼:

  • 记性好:在识别了 15 个不同的人之后,它依然能准确识别第 1 个人,遗忘率很低。
  • 比对手强:它比那些不需要存数据的传统方法(如 LwF, EWC)表现更好,甚至接近那些需要存大量旧数据的“笨重”方法。
  • 抗干扰:即使在只有 10%-20% 数据有标签的情况下,它依然能保持高性能,而其他方法这时候就“晕”了。

总结

CLAD-Net 就像是一位拥有“超级记忆力”和“隐私洁癖”的健康管家。

  • 他通过观察(自监督学习)掌握了人类运动的通用法则(长期记忆)。
  • 他通过温故知新(知识蒸馏)在教新人的同时,绝不遗忘旧人的习惯。
  • 最重要的是,他不需要偷看你以前的隐私录像,就能变得越老越聪明。

这项技术对于未来的远程医疗、老人跌倒监测、康复训练等领域意义重大,因为它让 AI 能够真正长期、安全地陪伴和监测每一个独特的个体。