Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Each language version is independently generated for its own context, not a direct translation.

这篇论文探讨了一个非常现实的问题：当物联网（IoT）设备（比如智能手表、医疗监测仪、智能家居）越来越多时，如何保护它们不被黑客攻击，而且还要能“活”得长久？

想象一下，你开了一家24 小时营业的“网络安全保安公司”。

1. 背景：为什么需要新保安？

现在的物联网设备像星星一样多，但黑客的手段也在不断进化。

旧方法的问题：以前的保安（传统的机器学习模型）就像背熟了《犯罪百科全书》的警察。如果黑客突然发明了一种全新的作案手法（比如以前只偷钱包，现在开始用无人机投毒），背书的警察就懵了，因为书里没写。这就是论文里说的**“概念漂移”**（Concept Drift）——环境变了，老经验不管用了。
隐私难题：这些设备产生的数据（比如你的心跳、家里的监控）非常敏感，不能全部传到中央服务器去训练保安。这就像不能把每个家庭的日记本都收走给警察看。
资源限制：物联网设备（如智能手环）电池小、算力弱，不能像超级计算机那样整天重新学习。

2. 解决方案：联邦学习 + 增量学习

为了解决这些问题，作者提出了一种**“分布式进修”**的方案：

联邦学习（Federated Learning）：
想象一下，保安们分散在各个小区（客户端）工作。他们不交日记本，而是**只把学到的“经验总结”（模型参数）**发给总部。总部把这些经验汇总，变成一本更聪明的《新保安手册》，再发回给各个小区。这样既保护了隐私，又利用了大家的智慧。
增量学习（Incremental Learning）：
这是论文的核心。以前的保安手册是“一次性印刷”的，要改就得重印（重新训练），太慢太贵。
现在的方案是**“活页夹”。当新的黑客手法出现时，保安不需要把整本书撕掉重印，只需要往活页夹里加几页新内容**，或者把旧内容稍微修改一下，就能学会新东西。

3. 实验：一场“黑客进化”的模拟赛

作者用了一个叫 CICIoMT2024 的超级数据集（里面包含了各种针对医疗物联网的攻击，比如 MQTT 协议攻击、拒绝服务攻击等），设计了一个时间轴（t0 到 t6）：

t0 阶段：只有几种简单的攻击。
t1 到 t6：每隔一段时间，黑客就升级一次，引入全新的攻击家族（比如从“普通偷窃”升级到“无人机投毒”）。
任务：看哪种“保安培训策略”能在不断变化的黑客面前，既保持高准确率，又不会累死（节省算力）。

4. 六种“培训策略”大比拼

作者测试了六种不同的“活页夹”更新方法，就像给保安不同的复习策略：

静态保安（Static）：只背第一天的书，后面不管发生什么，都不更新。
- 结果：第一天表现不错，后面黑客一变，保安就彻底懵了，准确率暴跌。
全量重学（Cumulative）：每次有新攻击，就把所有见过的旧攻击数据 + 新攻击数据，全部重新学一遍。
- 结果：准确率最高，最聪明。但是！这就像保安每天要把过去 10 年的所有案件卷宗全部重读一遍，太累、太慢、太费电，小设备扛不住。
简单遗忘（Simple Incremental）：只学新来的，把旧的直接扔掉。
- 结果：学得快，但忘得快。保安学会了防无人机，结果忘了怎么防偷钱包，最后连基本的都防不住（这叫“灾难性遗忘”）。
代表人物法（Representative）：每次学新攻击时，从旧攻击里**挑一个“典型代表”**留着复习。
- 结果：非常聪明！既没忘老本行，又学会了新招数。而且因为只复习“代表”，负担比全量重学轻多了。
样本保留法（Retention）：不挑代表，而是从旧数据里硬塞一小堆样本（比如 100 个或 500 个）进活页夹一起学。
- 结果：效果也很棒，准确率很高，而且比全量重学快得多。就像保安只复习了“精选错题集”，而不是整本错题集。
平均法（Averaging）：把新旧模型参数取个平均值。
- 结果：效果一般，有点像“和稀泥”，没完全学会新东西，也没完全保住旧知识。

5. 核心发现：什么才是最佳策略？

最聪明但最累：全量重学。如果你有大服务器，不在乎时间，选这个，准确率最高。
最平衡（推荐）：代表人物法和样本保留法。
- 这就好比**“带着错题集去考试”**。保安不需要重读所有旧书，只需要带着几页关键的“旧案例”和“新案例”一起复习。
- 优点：准确率依然很高（几乎和全量重学一样），但训练速度快了一倍多，非常适合电池和算力有限的物联网设备。
最危险：简单遗忘。千万别只学新的不复习旧的，否则保安会“精神分裂”，防住了新黑客，却放走了老小偷。

6. 总结与比喻

这篇论文告诉我们，在物联网安全的世界里，“死记硬背”（静态模型）行不通，“彻底重来”（全量重学）太累人，“只学新的”（简单增量）会失忆。

最好的办法是**“温故而知新”**（增量学习中的保留策略）：

就像一位经验丰富的老侦探，面对新的犯罪手法，他不会把过去几十年的档案全烧了，也不会把档案全背一遍。他只是翻出几本最经典的旧案卷（保留样本/代表），结合新线索，快速更新自己的办案思路。

最终结论：在资源受限的物联网设备上，采用保留少量旧数据（样本或代表）的增量联邦学习，是应对不断变化的网络威胁最经济、最高效的“生存之道”。

Each language version is independently generated for its own context, not a direct translation.

1. 研究背景与问题 (Problem)

背景：物联网（IoT）设备的激增扩大了网络攻击面，使得传统的集中式入侵检测系统（IDS）面临隐私泄露和通信开销大的挑战。联邦学习（FL）通过在不共享原始数据的情况下训练模型，成为了解决隐私问题的有效方案。
核心问题：
1. 概念漂移（Concept Drift）：网络攻击模式随时间演变，攻击者不断开发新技术，导致训练数据的分布发生变化。静态模型无法适应这种动态变化，性能会随时间退化。
2. 灾难性遗忘（Catastrophic Forgetting）：在增量学习（Incremental Learning）过程中，模型在学习新攻击模式时，往往会“遗忘”旧的攻击模式，导致对历史攻击的检测能力下降。
3. 资源受限：IoT 设备计算资源有限，无法支持频繁的全量重训练（Full Retraining）。
研究目标：在联邦学习设置下，设计一种增量学习策略，使 IDS 模型能够持续适应演变的威胁（非平稳环境），同时防止灾难性遗忘，并兼顾计算效率（低延迟）。

2. 方法论 (Methodology)

2.1 数据集与实验设置

数据集：使用 CICIoMT2024 数据集（针对医疗物联网 IoMT），包含 40 台设备产生的流量，涵盖 5 大类攻击（MQTT, DoS, DDoS, 侦察 Recon, 欺骗 Spoofing）共 18 种变体。
时间线构建 (Timeline Construction)：
- 模拟了从 $t_0$ 到 $t_6$ 的时间段，模拟攻击类别的逐步引入（概念漂移）。
- $t_0$ ：作为基线，包含每类攻击的一个代表性样本（仅用于 6 分类任务）。
- $t_1 - t_5$ ：每个时间段引入新的攻击家族（例如 $t_1$ 引入 MQTT， $t_2$ 引入 DoS 等）。
- $t_6$ ：仅用于测试，包含所有攻击类别，用于评估模型在完全暴露后的泛化能力。
联邦设置：使用 Flower 框架，5 个客户端，数据同分布（IID）划分，以隔离时间漂移的影响。
模型架构：多层 LSTM（长短期记忆网络），5 个隐藏层，每层 128 个单元，输入 45 个归一化特征。

2.2 提出的增量学习策略

研究对比了多种联邦增量学习策略，旨在解决灾难性遗忘：

静态训练 (Static)：仅在初始时间训练一次，后续不更新（作为基线，表现最差）。
累积增量学习 (Cumulative Incremental)：在每个时间点，将新数据与所有历史数据合并进行训练。性能最好但计算成本最高。
简单增量学习 (Simple Incremental)：仅使用当前时间步的新数据进行训练，完全丢弃旧数据。导致严重的遗忘。
代表性增量学习 (Representative Incremental)：
- 在每个时间步，引入新出现的攻击家族，同时从其他所有类别中保留一个代表性攻击样本。
- 确保模型始终在平衡的 6 类标签空间上训练，防止类别消失。
基于保留的增量学习 (Incremental Learning by Retention)：
- 从历史数据中保留少量样本（100, 500, 或 1000 个）作为“记忆缓冲区”，与新数据混合训练。
- 旨在用最小的存储开销缓解遗忘。
参数平均法 (Averaging Variants)：
- 包括简单平均、样本加权平均和指数移动平均（EMA）。
- 通过平均过去模型的参数来初始化新模型，而非重新训练数据。

3. 主要贡献 (Key Contributions)

首个系统性基准测试：在显式建模的时间漂移场景下，首次对分布式 IoT 环境中的增量联邦学习策略进行了系统性基准测试。
多维评估框架：提出了一个基于时间线（ $t_0-t_6$ ）的评估框架，同时考虑了二分类（良性 vs 恶意）和多分类（6 类攻击）场景，深入分析了不同策略在概念漂移下的表现。
权衡分析：详细量化了不同策略在检测精度与计算延迟（训练/推理时间）之间的权衡，为资源受限的 IoT 环境提供了选型依据。
发现攻击家族间的分布差异：通过热力图分析发现，MQTT 和 DDoS 攻击家族之间存在最大的分布差异（Distributional Divergence），这对漂移模拟至关重要。

4. 实验结果 (Results)

4.1 准确性表现 (Accuracy)

二分类任务：
- 表现最佳：代表性增量学习 (Representative Incremental) 平均准确率达到 95.73%，略高于累积增量学习 (93.30%)。
- 次优：基于保留的方法（100-1000 样本）表现稳健，平均准确率在 91.92% - 92.74% 之间。
- 失败案例：简单增量学习和参数平均法在后期时间步（ $t_6$ ）准确率急剧下降（低至 45%-58%），证明其无法应对累积漂移。
六分类任务：
- 表现最佳：累积增量学习 平均准确率最高 (66.7%)，但计算代价大。
- 高效平衡：代表性增量学习 (64.5%) 和 基于保留的方法 (63.6%-64.6%) 在保持高准确率的同时显著降低了计算成本。
- 静态模型：仅在无漂移的基线 ( $t_0$ ) 表现良好，随后迅速失效。

4.2 延迟与效率 (Latency & Efficiency)

训练时间：
- 累积增量学习 耗时最长（二分类约 688.8 秒，六分类约 603.5 秒），是简单增量学习的 2.5 倍以上。
- 基于保留的方法（如保留 100 个样本）训练时间最短（约 255-318 秒），且精度损失极小，是性价比最高的方案。
- 代表性增量学习 耗时中等（约 422-481 秒），提供了良好的精度 - 效率平衡。
推理时间：所有策略的推理延迟基本一致（约 2.0-2.4 秒），表明推理成本主要由 LSTM 架构决定，而非训练策略。

5. 意义与结论 (Significance & Conclusion)

核心结论：在动态演变的 IoT 威胁环境中，累积增量学习虽然精度最高，但代表性增量学习和基于小样本保留的增量学习提供了更优的实用方案。它们能够在大幅降低计算资源消耗（训练时间减少 50% 以上）的同时，维持极高的检测精度，有效防止灾难性遗忘。
实际意义：该研究为资源受限的 IoT 设备提供了可行的非平稳 IDS 部署方案。它证明了不需要频繁的全量重训练，通过巧妙的样本保留或代表性采样，即可实现长期的鲁棒检测。
未来工作方向：
- 探索自适应漂移检测机制，动态触发模型更新而非依赖固定时间步。
- 研究**非 IID（非独立同分布）**环境下的增量联邦学习，模拟更真实的客户端数据异构性。
- 处理类别涌现（Class Emergence）问题，即新攻击类别在部分客户端先出现的情况。

总结：该论文通过严谨的实验证明了在联邦学习框架下，结合增量学习策略（特别是代表性采样和小样本保留）是解决 IoT 网络中概念漂移和灾难性遗忘问题的有效途径，为构建自适应、低成本的下一代入侵检测系统奠定了理论基础。