Benchmarking Federated Learning in Edge Computing Environments: A Systematic Review and Performance Evaluation
本文通过系统综述与性能评估,从优化策略、通信效率、隐私保护及系统架构四个维度分析了边缘计算环境下的联邦学习技术,揭示了不同算法在准确率、能耗等指标上的优劣,并指出了数据异构性等现存挑战与未来研究方向。
2385 篇论文
本文通过系统综述与性能评估,从优化策略、通信效率、隐私保护及系统架构四个维度分析了边缘计算环境下的联邦学习技术,揭示了不同算法在准确率、能耗等指标上的优劣,并指出了数据异构性等现存挑战与未来研究方向。
该论文提出了名为 Auralink SDC 的边缘部署 AI 架构,通过置信度校准自主修复、自适应检索增强推理及分层多智能体编排等关键技术,在满足严格安全约束的商用硬件上实现了亚 50 毫秒延迟,从而将电动汽车充电基础设施的自主故障解决率提升至 78%。
本文提出了一种基于敏感度引导的压缩框架,通过系统性地探索量化与剪枝的权衡,在 FPGA 实现中显著提升了储层计算加速器的硬件效率(如降低功耗延迟积),同时保持了模型精度。
本文综述了 FPGA 在深度学习加速中的应用,探讨了包括流水线、并行化、量化及存储层次优化在内的硬件优化技术,分析了现有加速器的现状与挑战,并展望了未来的设计创新方向。
该论文提出了结合令牌级 KV 缓存淘汰与 PagedAttention 的“压缩 PagedAttention"技术,并据此开发了 Zipage 推理引擎,在大规模数学推理任务中实现了超过 2.1 倍的加速,同时保持了接近全量 KV 缓存 95% 的推理性能。
该研究通过对 Qwen2.5 系列模型进行系统性的逐层与逐块敏感性分析,揭示了前馈网络(MLP)的上下投影层对 FP4 量化最为敏感,且敏感性在不同模型规模、网络深度及 MXFP4 与 NVFP4 格式间存在显著差异,从而为 FP4 推理诊断提供了关键依据。
本文针对多变量时间序列建模中变量顺序人为性导致的问题,从理论上证明了置换等变线性状态空间系统的规范形式,并据此提出了 VI 2D SSM 及其架构 VI 2D Mamba,通过消除变量轴上的序列依赖链,在降低计算复杂度与简化稳定性分析的同时实现了卓越的性能。
本文提出了 HCAPO 框架,通过利用大语言模型进行事后推理以优化步级 Q 值估计并引入多尺度优势机制修正价值基线,有效解决了长程任务中的稀疏奖励与信用分配难题,在 WebShop 和 ALFWorld 等基准测试中显著超越了现有强化学习方法。
本文介绍了 Turn,一种专为代理软件设计的编译型、基于 Actor 的编程语言,它通过认知类型安全、置信度操作符、隔离的 Actor 进程模型、基于能力的身份系统以及编译时模式吸收等五项语言级构造,将大语言模型推理、状态管理和凭证隔离等关键特性从应用层惯例提升为语言级保障。
该论文提出了一种将群 在乘积空间 上的不变函数简化为 的迷向子群 在 上不变量的通用方法,通过建立轨道等价关系消除了现有等变神经场方法的结构限制,使其能够适用于任意群作用和同质条件空间。
本文提出了 EDMFormer,一种结合自监督音频嵌入与特定电子舞曲(EDM)数据集(EDM-98)的 Transformer 模型,通过利用能量、节奏和音色变化等 EDM 特有结构特征,显著提升了该流派音乐结构分割(特别是 Drop 和 Buildup 段落)的边界检测与分类性能。
本文通过批判性评估当前对齐社区在借鉴安全保证领域经验时的局限性,结合成熟的安全保证理论与方法,提出了针对欺骗性对齐和核生化(CBRN)能力等前沿 AI 系统的安全案例新框架,旨在构建更稳健、可辩护且实用的安全论证基础。
本文提出了一种结合技能基课程学习的多层级元强化学习框架,通过递归压缩马尔可夫决策过程(MDP)来构建层级结构,从而有效降低随机性、解耦子任务并促进技能在不同问题与层级间的迁移,最终实现更高效且可解释的复杂序列决策。
该论文提出了一种利用大语言模型通过按需生成工具来自动化超导量子比特控制与测量的框架,成功实现了谐振器自主表征及量子非破坏性测量的复现,为复杂量子硬件的实验部署提供了更灵活、用户友好的范式。
该论文提出了测试驱动 AI 代理定义(TDAD)方法,通过将代理提示视为编译产物,利用编码代理将行为规范转化为可执行测试并迭代优化提示,结合可见/隐藏测试分割、语义变异测试及规范演进场景等机制,有效解决了工具型大语言代理在生产部署中因提示微调导致的静默回归、工具滥用及策略违规等难以量化的合规性问题。
Scale-Plan 是一个可扩展的框架,它利用大语言模型从自然语言指令中提取紧凑的任务相关表示,通过构建动作图并引导结构化搜索来过滤无关信息,从而有效解决异构多机器人系统在复杂长时程任务规划中的可扩展性与可靠性问题,并在其提出的 MAT2-THOR 基准测试中显著优于现有方法。
该论文通过跨文本与多模态基准的实验,证实了检索质量(特别是基于覆盖率的指标)与 RAG 生成响应的信息覆盖率之间存在强相关性,表明检索指标可作为评估 RAG 系统性能的有效代理。
Fish Audio S2 是一款开源的多说话人、多轮次且支持自然语言指令控制的高级文本转语音系统,其通过多阶段训练与数据流水线实现了生产级流式推理(RTF 0.195,首字延迟<100ms),并公开了模型权重、微调代码及基于 SGLang 的推理引擎。
该论文提出了名为 GenGNN 的模块化消息传递框架,证明了在离散图生成任务中,无需依赖高表达力的 Transformer 等复杂架构,仅使用 GenGNN 作为扩散模型骨干即可在保持与图 Transformer 相当的有效性(如树和平面图数据集超过 90%、分子生成达 99.49%)的同时,实现 2 至 5 倍的推理速度提升。
该论文提出了 MASEval 框架,旨在填补现有基准测试仅关注模型而忽视系统实现(如拓扑结构和编排逻辑)的空白,通过系统级评估证明框架选择对多智能体系统性能的影响与模型选择同等重要。