cs.CR 篇论文 | Gist.Science

Measuring Privacy vs. Fidelity in Synthetic Social Media Datasets

该研究提出了一种将重识别视为作者归属攻击的评估框架，通过分析大语言模型生成的合成 Instagram 帖子，量化了其在作者归属风险降低（隐私性提升）与文本保真度之间的权衡关系。

Henry Tari, Adriana Iamnitchi2026-03-06🔒 cs.CR

How Effective Are Publicly Accessible Deepfake Detection Tools? A Comparative Evaluation of Open-Source and Free-to-Use Platforms

本文通过专业调查员的盲测评估，首次对比了六款公开可及的深伪检测工具，发现法医分析工具与 AI 分类器在召回率和特异性上各有所长但均不及人类判断，且人机判断不一致时人类结论通常更为可靠。

Michael Rettinger, Ben Beaumont, Nhien-An Le-Khac, Hong-Hanh Nguyen-Le2026-03-06🔒 cs.CR

Benchmark of Benchmarks: Unpacking Influence and Code Repository Quality in LLM Safety Benchmarks

该论文首次对大语言模型安全基准测试进行了多维评估，发现其在学术影响力上并无显著优势，且代码质量普遍低下，揭示了作者声望与代码质量之间的错位，并呼吁知名研究者带头提升标准。

Junjie Chu, Xinyue Shen, Ye Leng, Michael Backes, Yun Shen, Yang Zhang2026-03-06🔒 cs.CR

Beyond Input Guardrails: Reconstructing Cross-Agent Semantic Flows for Execution-Aware Attack Detection

本文提出了名为 SysName 的框架，通过重构跨代理语义流并引入执行感知的 Supervisor LLM 分析，将多智能体系统的防御范式从静态输入过滤转变为动态行为轨迹监控，从而有效检测包括间接提示注入在内的多种复杂攻击。

Yangyang Wei, Yijie Xu, Zhenyuan Li, Xiangmin Shen, Shouling Ji2026-03-06🔒 cs.CR

Impact of 5G SA Logical Vulnerabilities on UAV Communications: Threat Models and Testbed Evaluation

本文通过构建基于 Open5GS、UERANSIM 和 Kubernetes 的测试床，评估了恶意 UE、5G 核心网及 gNodeB 三种攻击场景下 5G 独立组网（SA）逻辑漏洞对无人机通信的威胁，揭示了控制指令篡改与数据会话中断等风险，并强调了用户面隔离与指令完整性保护的必要性。

Wagner Comin Sonaglio, Ágney Lopes Roth Ferraz, Lourenço Alves Pereira Júnior2026-03-06🔒 cs.CR

When Denoising Becomes Unsigning: Theoretical and Empirical Analysis of Watermark Fragility Under Diffusion-Based Image Editing

本文从理论与实证角度揭示了基于扩散模型的图像编辑技术如何通过去噪过程系统性衰减并消除鲁棒隐形水印，导致水印在编辑后几乎无法被解码，并据此提出了相应的伦理考量与设计指南。

Fai Gu, Qiyu Tang, Te Wen, Emily Davis, Finn Carter2026-03-06🔒 cs.CR

Efficient Privacy-Preserving Sparse Matrix-Vector Multiplication Using Homomorphic Encryption

本文提出了首个高效结合同态加密与稀疏矩阵向量乘法的框架，通过设计专为加密计算优化的“压缩稀疏排序列（CSSC）”格式，显著降低了存储与计算开销，从而在保障数据隐私的同时实现了显著的性能提升。

Yang Gao, Gang Quan, Wujie Wen, Scott Piersall, Qian Lou, Liqiang Wang2026-03-06🔒 cs.CR

ShieldBypass: On the Persistence of Impedance Leakage Beyond EM Shielding

该论文通过实验证明，尽管电磁屏蔽能有效抑制辐射发射，但主动射频探测仍可利用阻抗调制背散射在屏蔽频带外观察到与执行状态相关的特征，从而揭示屏蔽系统下的硬件侧信道泄漏风险。

Md Sadik Awal, Md Tauhidur Rahman2026-03-06🔒 cs.CR

Osmosis Distillation: Model Hijacking with the Fewest Samples

本文提出了名为“渗透蒸馏”（Osmosis Distillation）的新型模型劫持攻击，揭示了在利用数据集蒸馏生成的合成数据进行迁移学习时，攻击者仅需极少量毒化样本即可在保持原任务高性能的同时成功植入隐藏恶意任务的安全威胁。

Yuchen Shi, Huajie Chen, Heng Xu, Zhiquan Liu, Jialiang Shen, Chi Liu, Shuai Zhou, Tianqing Zhu, Wanlei Zhou2026-03-06🔒 cs.CR

AgentSCOPE: Evaluating Contextual Privacy Across Agentic Workflows

该论文提出了基于情境完整性理论的"Privacy Flow Graph"框架及包含 62 个多工具场景的 AgentSCOPE 基准，旨在通过细粒度追踪代理工作流中的中间信息流，揭示现有仅关注输入输出边界的隐私评估方法严重低估了风险，并发现超过 80% 的场景中存在隐私泄露，且主要源于工具响应阶段的数据 indiscriminate 返回。

Ivoline C. Ngong, Keerthiram Murugesan, Swanand Kadhe, Justin D. Weisz, Amit Dhurandhar, Karthikeyan Natesan Ramamurthy2026-03-06🔒 cs.CR

EVMbench: Evaluating AI Agents on Smart Contract Security

该论文介绍了 EVMbench，这是一个基于 117 个精心策划的漏洞和真实以太坊执行环境的评估基准，用于衡量 AI 代理在智能合约安全中检测、修复及利用漏洞的能力，并发现前沿代理已具备在真实区块链实例中端到端发现并利用漏洞的风险。

Justin Wang, Andreas Bigger, Xiaohai Xu, Justin W. Lin, Andy Applebaum, Tejal Patwardhan, Alpin Yukseloglu, Olivia Watkins2026-03-06🔒 cs.CR

Modification to Fully Homomorphic Modified Rivest Scheme

本文阐述了完全同态改进 Rivest 方案（FHMRS），分析了其存在的安全问题，并提出了一种改进方案（mFHMRS）以缓解该问题。

Sona Alex, Bian Yang2026-03-06🔒 cs.CR

A Practical Post-Quantum Distributed Ledger Protocol for Financial Institutions

本文提出了一种基于格的后量子分布式账本协议，通过引入新型零知识证明技术和紧凑范围证明，解决了传统金融机构在采用私有账本时面临的隐私与审计难题，实现了兼具机密性、可审计性及多资产高效验证的加密交易方案。

Yeoh Wei Zhu, Naresh Goud Boddu, Yao Ma, Shaltiel Eloul, Giulio Golinelli, Yash Satsangi, Rob Otter, Kaushik Chakraborty2026-03-06🔒 cs.CR

Good-Enough LLM Obfuscation (GELO)

GELO 提出了一种轻量级的大语言模型混淆协议，通过在可信执行环境中对隐藏状态进行每批次不可复用的随机可逆混合，在仅增加约 20-30% 延迟的前提下有效抵御了针对共享加速器内存的统计攻击，同时保持输出精度不变。

Anatoly Belikov, Ilya Fedotov2026-03-06🔒 cs.CR

Cyber Threat Intelligence for Artificial Intelligence Systems

本文探讨了传统网络威胁情报如何演进以应对针对人工智能系统的攻击，通过梳理现有安全格局、构建面向AI的威胁情报知识库框架（包括具体指标和相似性度量技术），并指出了当前资源的不足与未来研究方向。

Natalia Krawczyk, Mateusz Szczepkowski, Adrian Brodzik, Krzysztof Bocianiak2026-03-06🔒 cs.CR

Robust Single-message Shuffle Differential Privacy Protocol for Accurate Distribution Estimation

本文针对纯洗牌差分隐私模型下的数值数据分布估计问题，提出了一种兼具高效用、低消息复杂度及强抗投毒攻击能力的单消息自适应洗牌分段（ASP）协议，并通过优化随机化机制与改进分布恢复算法，在多项指标上显著优于现有基线方法。

Xiaoguang Li, Hanyi Wang, Yaowei Huang, Jungang Yang, Qingqing Ye, Haonan Yan, Ke Pan, Zhe Sun, Hui Li2026-03-06🔒 cs.CR

Lambda-randomization: multi-dimensional randomized response made easy

本文提出了一种名为 Lambda-randomization 的多维随机响应协议，通过引入仅包含参数、单位矩阵和全 1 向量的直观参数化方法，有效克服了传统方法在处理高维数据时面临的计算成本高和估计精度下降的维度灾难问题。

Nicolas Ruiz2026-03-06🔒 cs.CR

Volley Revolver: A Novel Matrix-Encoding Method for Privacy-Preserving Neural Networks (Inference)

本文提出了一种名为“Volley Revolver"的新型矩阵编码方法，通过同态加密实现了在云端对加密 MNIST 图像进行高效的隐私保护卷积神经网络推理，仅需上传约 19.8 MB 的单个密文即可在 40 核云服务器上于 287 秒内完成 32 张图像的批量分类。

John Chiang2026-03-05💻 cs

virtCCA: Virtualized Arm Confidential Compute Architecture with TrustZone

本文提出了名为 virtCCA 的架构，利用现有的 Arm TrustZone 技术（支持 S-EL2 及更早平台）虚拟化实现 Arm 机密计算架构（CCA），通过构建完整的软件固件栈在真实服务器上验证了其在兼容 CCA 规范的同时具备可接受的运行开销。

Xiangyi Xu, Wenhao Wang, Yongzheng Wu + 7 more2026-03-05💻 cs

Sample-Optimal Locally Private Hypothesis Selection and the Provable Benefits of Interactivity

本文提出了一种仅需 $O(\log \log k)$ 轮交互的 $\varepsilon$ -局部差分隐私算法，将 $k$ 个分布假设选择问题的样本复杂度从非交互情形下的 $\Omega(k \log k)$ 优化至最优的 $\Theta(k)$ ，从而证明了交互性在该场景下的显著优势。

Alireza F. Pour, Hassan Ashtiani, Shahab Asoodeh2026-03-05🤖 cs.LG