A Survey on Decentralized Federated Learning

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是一份**“去中心化联邦学习（DFL）”的终极指南**。为了让你轻松理解，我们可以把整个机器学习的过程想象成**“一群学生共同写一本百科全书”**。

1. 背景：为什么要搞“去中心化”？

传统的联邦学习（FL）：有一个“班长”（中央服务器）
想象一下，全班同学（数据拥有者）都想一起写一本百科全书，但大家不想把自己的笔记（隐私数据）交给别人看。

做法： 老师（中央服务器）发给大家一个空本子。大家在自己家里把笔记写进本子，然后只把写好的页码交给老师。老师把所有页码拼起来，变成一本新的大书，再发回给大家。
问题：
- 班长太累了： 如果全班有几千几万人，老师累得半死，网络也堵死了。
- 班长是单点故障： 如果老师生病了或电脑坏了，整个项目就停摆了。
- 信任危机： 虽然老师没看大家的原始笔记，但老师手里握着所有“页码”，如果老师是坏人，或者被黑客攻击，大家的隐私还是可能泄露。

去中心化联邦学习（DFL）：没有班长，大家“互相抄作业”
为了解决上述问题，大家决定不要班长了。

做法： 每个人还是在自己家里写笔记。但是，写完一页后，只发给身边的几个邻居（比如同桌、前后桌）。邻居收到后，把自己的和邻居的拼一下，再传给他们的邻居。就这样，信息像涟漪一样在班级里扩散，最后大家都能得到一本接近完美的百科全书。
好处： 没有班长，就算几个人掉线了，其他人还能继续传；大家的隐私更分散，不容易被一次性偷光。
新麻烦： 怎么保证邻居不传假作业？怎么保证大家传得够快？怎么让大家都愿意干活？

2. 这篇论文主要讲了什么？

这篇论文就像是一个**“侦探报告”**，调查了从 2018 年到 2026 年（预测）所有关于“没有班长的学习小组”的研究。作者把大家的方法分成了两大派系：

派系一：传统分布式派（TD-FL）——“靠人情和算法”

核心思想： 就像一群朋友在微信群里传文件。大家靠算法来协调，比如“只传给最像我的那个人”或者“把文件切碎了传”。
擅长解决：
- 网速慢： 大家只传一点点关键信息，不传整个大文件。
- 数据不一样： 比如有的学生擅长数学，有的擅长语文，算法能让大家互相学习而不乱套。
- 有人掉线： 即使有人突然退群，网络也能自动重新连接。
现状： 这是目前研究最多的方向，大家都在想办法让传得更快、更准。

派系二：区块链派（BC-FL）——“靠账本和代币”

核心思想： 引入一个**“公共账本”（区块链）**。每个人写完作业，不是直接传给邻居，而是先记在公共账本上。
擅长解决：
- 谁干了活？ 账本上记得清清楚楚，谁贡献了多少，就发多少**“代币”（奖励）**。这解决了“谁愿意干活”的问题。
- 防篡改： 账本是公开的，谁想偷偷改作业，全网都会发现。
现状： 前几年（2019-2022）很火，但后来大家发现，记账太慢了，太费电了。就像为了传个文件，非要大家先开个会投票一样，效率有点低。现在大家觉得，除非特别需要“记账”和“发钱”，否则没必要用区块链。

3. 大家遇到了哪些大难题？（挑战）

论文总结了五个主要“拦路虎”：

有人掉队（容错性）： 就像微信群里有人手机没电了，或者网断了。在去中心化的网络里，如果中间几个人断了，信息就传不过去了，整个网络可能分裂成互不相通的小圈子。
传得太慢（带宽利用）： 如果每个人都把整个大文件发给所有邻居，网络会瞬间瘫痪。大家得想办法“切块”传输，或者只传精华。
大家水平不一（数据异构）： 有的学生是学霸，有的是学渣；有的数据是中文，有的是英文。如果强行把他们的笔记拼在一起，最后出来的书可能既不像中文也不像英文，全是乱码（这叫“客户端漂移”）。
坏人捣乱（安全与隐私）：
- 投毒： 坏人故意传错的答案，想污染整本书。
- 偷窥： 虽然没看原始笔记，但通过分析别人传回来的“页码”，坏人可能反推出你写了什么（隐私泄露）。
- 去中心化后，每个邻居都能看到你的“页码”，风险反而变大了。
没人愿意干（激励机制）： 写笔记要花钱（电费、时间）。如果没有奖励，大家可能都偷懒，只看不写（白嫖）。怎么设计一个公平的奖励系统，让大家愿意贡献，是个大难题。

4. 未来的路怎么走？（结论与展望）

作者最后给未来的研究指了几个方向：

别只盯着“全球一本大书”： 在去中心化世界里，可能根本不存在一本完美的“全球通用书”。也许我们应该接受“每个小圈子有一本适合他们的小书”（个性化模型）。
安全要更聪明： 现在的防御太简单了。未来的防御要能识别出那些“看起来像好人，但其实是想偷偷占便宜”的聪明坏人。
隐私要重新定义： 在去中心化网络里，隐私不再是“只有老师看不见”，而是“连邻居也不能随便看”。需要新的数学工具来保护。
奖励要更靠谱： 现在的奖励要么看谁数据多，要么看谁算得准。未来要设计一种机制，既能保护隐私，又能公平地奖励那些真正让模型变好的人。

一句话总结

这篇论文告诉我们：去掉“班长”（中央服务器）能让学习系统更抗揍、更隐私，但也让“怎么传作业”、“怎么防坏人”和“怎么发工资”变得更复杂了。 现在的研究正在努力平衡这些矛盾，让“去中心化学习”从理论走向现实。

Each language version is independently generated for its own context, not a direct translation.

这是一份关于《去中心化联邦学习综述》（A Survey on Decentralized Federated Learning）的详细技术总结。该论文系统回顾了 2018 年至 2026 年初的去中心化联邦学习（DFL）文献，旨在解决传统联邦学习（FL）中中心化协调器带来的单点故障、信任集中和扩展性瓶颈等问题。

1. 研究背景与问题定义 (Problem)

传统联邦学习（FL）的局限性：
标准 FL 采用“客户端 - 服务器”架构，依赖中心协调器进行模型聚合。这种架构存在以下核心问题：

单点故障（Single Point of Failure）： 中心服务器崩溃会导致整个系统瘫痪。
信任与隐私风险： 服务器掌握所有客户端的模型更新，易受到模型反演、成员推断和数据重构攻击；服务器本身也可能是恶意的（如投毒攻击）。
通信与扩展性瓶颈： 随着客户端数量增加，服务器面临巨大的带宽压力和计算负载，导致高延迟。

去中心化联邦学习（DFL）的挑战：
DFL 移除了中心服务器，采用点对点（P2P）架构，节点之间直接交换和聚合模型更新。虽然消除了单点故障，但引入了新的挑战：

容错性： 节点动态加入/退出（Churn）和链路不可靠可能导致网络分裂或模型更新丢失。
带宽利用： 在完全连接拓扑中，通信复杂度呈 $O(n^2)$ ，难以扩展。
数据异构性（Non-IID）： 缺乏中心协调器来平衡不同分布的数据，容易导致“客户端漂移”（Client Drift），阻碍全局收敛。
安全与隐私： 每个节点都能访问邻居的模型更新，攻击面扩大；且缺乏中心实体来执行统一的防御策略。
激励机制： 缺乏中心奖励机制，难以防止“搭便车”行为，难以激励节点贡献高质量数据和算力。

2. 研究方法 (Methodology)

本文遵循 PRISMA（系统综述和荟萃分析首选报告项目）指南，进行了系统的文献综述：

时间跨度： 2018 年至 2026 年初。
数据来源： IEEE Xplore, ScienceDirect, ACM Digital Library, Google Scholar 等。
筛选标准： 仅纳入明确定义为去中心化框架、将聚合任务委托给对等节点（而非中心实体）、且具有实质性架构或算法创新的论文。
最终样本： 从 123 篇初选文章中筛选出 35 篇核心文献进行深入分析。
分类体系： 提出了一个统一的、以挑战为导向的分类法，将 DFL 方法分为两大架构家族，并映射到其解决的核心瓶颈。

3. 核心贡献与分类体系 (Key Contributions & Taxonomy)

论文提出了一个统一的分类法，将 DFL 方法分为两大类，并详细分析了它们针对的不同挑战：

A. 传统分布式联邦学习 (Traditional Distributed FL, TD-FL)

利用标准分布式计算技术（如 P2P 网络）实现去中心化。

主要特点： 侧重于通信效率、异构性处理和理论分析。
关键子领域：
- 容错性： 设计在节点掉线或链路不稳定时仍能保持模型流动的机制（如 IPLS, DSpodFL）。
- 隐私与安全： 使用代理模型（ProxyFL）、可验证加密（PVD-FL）、去中心化差分隐私（f-DP）和更新分片（ERIS）来保护隐私。
- 带宽利用： 采用 gossip 协议、模型分块和压缩技术减少通信量（如 Combo, GossipFL）。
- 数据异构性： 通过知识蒸馏、贝叶斯变分推断或自适应邻居选择来缓解 Non-IID 问题（如 Def-KT, PANM）。
- 理论与任务扩展： 提供统计推断、不确定性量化及针对特定任务（如 SVD）的无服务器方案。

B. 基于区块链的联邦学习 (Blockchain-based FL, BC-FL)

利用区块链作为协调和问责层，记录训练过程并支持激励结算。

主要特点： 侧重于安全性、审计性、不可篡改性和激励机制。
关键子领域：
- 容错与协调： 利用智能合约和环形/委员会拓扑替代中心服务器（如 FED-BC, GFL）。
- 隐私与安全： 结合差分隐私、同态加密和秘密共享，利用区块链的不可篡改性进行审计（如 DeepChain, Biscotti）。
- 激励机制： 引入代币奖励、Shapley 值计算或基于准确性的共识（Proof-of-Accuracy）来激励参与（如 FedCoin, BlockFL）。
- 资源效率： 优化异步参与、区块生成速率和端到端延迟（如 BAFL, BLADE-FL）。

趋势观察：

BC-FL 的研究集中在 2019-2022 年，随后热度下降，表明区块链更多被视为特定需求（如审计、激励）的组件，而非去中心化的默认基础。
TD-FL 在 2023-2025 年持续增长，研究重点转向更轻量级的 P2P 协调、鲁棒性、异构性和通信效率。

4. 主要发现与评估结果 (Results & Findings)

评估现状的局限性： 现有研究大多在小型、干净的基准数据集（如 MNIST, CIFAR-10）上进行水平划分（Horizontal Partitioning）的评估，缺乏对真实世界异构、资源受限部署的验证。垂直联邦学习（Vertical FL）在 DFL 中研究较少。
安全与隐私的权衡：
- 在 DFL 中，每个节点都有本地验证集，这为基于验证的防御提供了机会，但也面临本地数据偏差和对抗性样本的威胁。
- 区块链虽然提供了审计能力，但也扩大了攻击面（如共识攻击、智能合约漏洞），且可能引入新的信任层级（矿工/验证者）。
激励机制的缺失： 在 TD-FL 中，激励机制研究几乎空白；在 BC-FL 中，激励机制多基于数据量或简单准确率，缺乏对隐私保护和拓扑结构的考量，难以有效防止策略性攻击（如“自私攻击”）。
全局模型的定义： 在高度动态或分区的 DFL 网络中，单一“全局模型”可能不再适用，研究正转向聚类模型或个性化解决方案。

5. 未来方向与意义 (Significance & Future Directions)

未来研究方向：

拓扑感知的威胁模型： 需要建立考虑网络拓扑、共谋和 Sybil 攻击的更复杂的安全评估基准。
去中心化隐私概念： 开发反映 DFL 暴露面（多节点观察、时间推移）的隐私度量标准，超越传统的服务器假设。
鲁棒的激励机制： 设计既能保护隐私（最小披露），又能抵抗操纵（如伪造贡献证据）且感知拓扑的激励机制。
现实场景的容错性： 研究在节点频繁掉线、链路间歇性中断和异步操作下的 DFL 性能，特别是网络分区后的模型恢复与合并策略。
明确优化目标： 明确 DFL 是追求单一全局模型，还是多簇模型或个性化模型，并据此设计评估协议。

论文意义：

统一视角： 首次将传统 P2P DFL 和基于区块链的 DFL 纳入统一的、以挑战为导向的分类框架，打破了以往按架构或安全单一维度分类的局限。
揭示差距： 系统性地指出了当前文献在评估协议标准化、真实场景覆盖、激励机制设计以及复杂威胁模型下的安全评估方面的空白。
指导实践： 为研究人员和从业者提供了清晰的路线图，帮助理解不同技术路线的权衡（Trade-offs），推动 DFL 从概念协议走向鲁棒的实际部署。

总结而言，这篇综述不仅梳理了 DFL 的技术演进，更深刻地指出了从“中心化”向“去中心化”范式转变过程中，系统、安全和隐私设计必须进行的根本性重构。