Measuring Privacy vs. Fidelity in Synthetic Social Media Datasets
该研究提出了一种将重识别视为作者归属攻击的评估框架,通过分析大语言模型生成的合成 Instagram 帖子,量化了其在作者归属风险降低(隐私性提升)与文本保真度之间的权衡关系。
362 篇论文
该研究提出了一种将重识别视为作者归属攻击的评估框架,通过分析大语言模型生成的合成 Instagram 帖子,量化了其在作者归属风险降低(隐私性提升)与文本保真度之间的权衡关系。
本文通过专业调查员的盲测评估,首次对比了六款公开可及的深伪检测工具,发现法医分析工具与 AI 分类器在召回率和特异性上各有所长但均不及人类判断,且人机判断不一致时人类结论通常更为可靠。
该论文首次对大语言模型安全基准测试进行了多维评估,发现其在学术影响力上并无显著优势,且代码质量普遍低下,揭示了作者声望与代码质量之间的错位,并呼吁知名研究者带头提升标准。
本文提出了名为 SysName 的框架,通过重构跨代理语义流并引入执行感知的 Supervisor LLM 分析,将多智能体系统的防御范式从静态输入过滤转变为动态行为轨迹监控,从而有效检测包括间接提示注入在内的多种复杂攻击。
本文通过构建基于 Open5GS、UERANSIM 和 Kubernetes 的测试床,评估了恶意 UE、5G 核心网及 gNodeB 三种攻击场景下 5G 独立组网(SA)逻辑漏洞对无人机通信的威胁,揭示了控制指令篡改与数据会话中断等风险,并强调了用户面隔离与指令完整性保护的必要性。
本文从理论与实证角度揭示了基于扩散模型的图像编辑技术如何通过去噪过程系统性衰减并消除鲁棒隐形水印,导致水印在编辑后几乎无法被解码,并据此提出了相应的伦理考量与设计指南。
本文提出了首个高效结合同态加密与稀疏矩阵向量乘法的框架,通过设计专为加密计算优化的“压缩稀疏排序列(CSSC)”格式,显著降低了存储与计算开销,从而在保障数据隐私的同时实现了显著的性能提升。
该论文通过实验证明,尽管电磁屏蔽能有效抑制辐射发射,但主动射频探测仍可利用阻抗调制背散射在屏蔽频带外观察到与执行状态相关的特征,从而揭示屏蔽系统下的硬件侧信道泄漏风险。
本文提出了名为“渗透蒸馏”(Osmosis Distillation)的新型模型劫持攻击,揭示了在利用数据集蒸馏生成的合成数据进行迁移学习时,攻击者仅需极少量毒化样本即可在保持原任务高性能的同时成功植入隐藏恶意任务的安全威胁。
该论文提出了基于情境完整性理论的"Privacy Flow Graph"框架及包含 62 个多工具场景的 AgentSCOPE 基准,旨在通过细粒度追踪代理工作流中的中间信息流,揭示现有仅关注输入输出边界的隐私评估方法严重低估了风险,并发现超过 80% 的场景中存在隐私泄露,且主要源于工具响应阶段的数据 indiscriminate 返回。
该论文介绍了 EVMbench,这是一个基于 117 个精心策划的漏洞和真实以太坊执行环境的评估基准,用于衡量 AI 代理在智能合约安全中检测、修复及利用漏洞的能力,并发现前沿代理已具备在真实区块链实例中端到端发现并利用漏洞的风险。
本文阐述了完全同态改进 Rivest 方案(FHMRS),分析了其存在的安全问题,并提出了一种改进方案(mFHMRS)以缓解该问题。
本文提出了一种基于格的后量子分布式账本协议,通过引入新型零知识证明技术和紧凑范围证明,解决了传统金融机构在采用私有账本时面临的隐私与审计难题,实现了兼具机密性、可审计性及多资产高效验证的加密交易方案。
GELO 提出了一种轻量级的大语言模型混淆协议,通过在可信执行环境中对隐藏状态进行每批次不可复用的随机可逆混合,在仅增加约 20-30% 延迟的前提下有效抵御了针对共享加速器内存的统计攻击,同时保持输出精度不变。
本文探讨了传统网络威胁情报如何演进以应对针对人工智能系统的攻击,通过梳理现有安全格局、构建面向AI的威胁情报知识库框架(包括具体指标和相似性度量技术),并指出了当前资源的不足与未来研究方向。
本文针对纯洗牌差分隐私模型下的数值数据分布估计问题,提出了一种兼具高效用、低消息复杂度及强抗投毒攻击能力的单消息自适应洗牌分段(ASP)协议,并通过优化随机化机制与改进分布恢复算法,在多项指标上显著优于现有基线方法。
本文提出了一种名为 Lambda-randomization 的多维随机响应协议,通过引入仅包含参数、单位矩阵和全 1 向量的直观参数化方法,有效克服了传统方法在处理高维数据时面临的计算成本高和估计精度下降的维度灾难问题。
本文提出了一种名为“Volley Revolver"的新型矩阵编码方法,通过同态加密实现了在云端对加密 MNIST 图像进行高效的隐私保护卷积神经网络推理,仅需上传约 19.8 MB 的单个密文即可在 40 核云服务器上于 287 秒内完成 32 张图像的批量分类。
本文提出了名为 virtCCA 的架构,利用现有的 Arm TrustZone 技术(支持 S-EL2 及更早平台)虚拟化实现 Arm 机密计算架构(CCA),通过构建完整的软件固件栈在真实服务器上验证了其在兼容 CCA 规范的同时具备可接受的运行开销。
本文提出了一种仅需 轮交互的 -局部差分隐私算法,将 个分布假设选择问题的样本复杂度从非交互情形下的 优化至最优的 ,从而证明了交互性在该场景下的显著优势。