Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

本文提出了一种针对医疗数据隐私风险的层次化双策略遗忘框架,通过几何约束梯度更新与概念感知令牌级干预相结合,在仅修改 0.1% 参数的情况下实现了 82.7% 的遗忘率与 88.5% 的知识保留,有效平衡了敏感信息移除与基础医疗能力保持的需求。

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing ChenThu, 12 Ma🤖 cs.LG

Defensive Refusal Bias: How Safety Alignment Fails Cyber Defenders

该论文揭示了大型语言模型在网络安全领域存在“防御性拒绝偏见”,即过度依赖语义相似性而非意图判断,导致模型频繁拒绝甚至因用户声明授权而更频繁地拒绝合法的防御性任务(如系统加固和恶意软件分析),从而阻碍了网络安全防御工作。

David Campbell, Neil Kale, Udari Madhushani Sehwag, Bert Herring, Nick Price, Dan Borges, Alex Levinson, Christina Q KnightThu, 12 Ma🤖 cs.AI

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

该论文在 NetSecGame 环境中评估了自主网络攻击代理在目标 IP 地址重分配场景下的泛化能力,发现尽管提示驱动的预训练大语言模型在未见地址空间下取得了最高成功率,但传统元学习代理仅表现出部分迁移能力,且所有方法均面临推理成本、可解释性或执行稳定性等方面的显著权衡。

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian GarciaThu, 12 Ma💻 cs

Building Privacy-and-Security-Focused Federated Learning Infrastructure for Global Multi-Centre Healthcare Research

本文提出了 FLA³ 平台,通过集成基于属性的访问控制、加密记账及研究范围联邦机制,在保障数据主权与合规性的前提下,实现了跨多国医疗机构的隐私保护联邦学习部署,并验证了其在临床预测性能上与集中式训练相当且能有效执行治理约束。

Fan Zhang, Daniel Kreuter, Javier Fernandez-Marques, BloodCounts Consortium, Gregory Verghese, Bernard Butler, Nicholas Lane, Suthesh Sivapalaratnam, Joseph Taylor, Norbert C. J. de Wit, Nicholas S. Gleadall, Carola-Bibiane Schönlieb, Michael RobertsThu, 12 Ma💻 cs