cs.CR 篇论文 | Gist.Science

SecureRAG-RTL: A Retrieval-Augmented, Multi-Agent, Zero-Shot LLM-Driven Framework for Hardware Vulnerability Detection

本文提出了 SecureRAG-RTL 框架，通过结合检索增强生成（RAG）与多智能体零样本技术，显著提升了大语言模型在缺乏公开数据集情况下的硬件描述语言（HDL）漏洞检测能力，并发布了包含真实漏洞的基准数据集以推动相关研究。

Touseef Hasan, Blessing Airehenbuwa, Nitin Pundir, Souvika Sarkar, Ujjwal GuinMon, 09 Ma🤖 cs.AI

Challenges and Design Considerations for Finding CUDA Bugs Through GPU-Native Fuzzing

本文针对异构系统中 GPU 软件栈内存安全不成熟的问题，指出当前依赖不忠实 CPU 转换的测试方法存在局限，并强调了行为忠实性对于设计原生 CUDA 模糊测试流程以发现 GPU 漏洞的关键作用。

Mingkai Li, Joseph Devietti, Suman Jana, Tanvir Ahmed KhanMon, 09 Ma💻 cs

Depth Charge: Jailbreak Large Language Models from Deep Safety Attention Heads

该论文提出了名为 SAHA 的新型越狱框架，通过识别深层注意力机制中的脆弱性并采用消融影响排序与分层扰动策略，成功突破了现有大语言模型的安全对齐，显著提升了攻击成功率。

Jinman Wu, Yi Xie, Shiqian Zhao, Xiaofeng ChenMon, 09 Ma🤖 cs.AI

Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models

该论文提出了“解耦安全假设”（DSH），通过几何分析揭示大语言模型中“识别有害性”与“执行拒绝”机制在深层解耦的现象，并据此开发了能实现“只知不行”状态的双差分提取与自适应因果引导方法，进而提出了具有 SOTA 攻击成功率的“拒绝擦除攻击”（REA）。

Jinman Wu, Yi Xie, Shen Lin, Shiqian Zhao, Xiaofeng ChenMon, 09 Ma🤖 cs.AI

Proof-of-Guardrail in AI Agents and What (Not) to Trust from It

该论文提出了“证明护栏”（Proof-of-Guardrail）系统，利用可信执行环境（TEE）为 AI 代理生成可验证的密码学证明，以确保证据表明响应确实经过了特定开源安全护栏的处理，同时指出即便有此类证明，恶意开发者仍可能通过主动越狱护栏来实施欺骗。

Xisen Jin, Michael Duan, Qin Lin, Aaron Chan, Zhenglun Chen, Junyi Du, Xiang RenMon, 09 Ma🤖 cs.AI

A Quantization-Aware Training Based Lightweight Method for Neural Distinguishers

该论文提出了一种基于量化感知训练的光纤神经网络区分器方法，通过将权重量化为 1.58 位并将激活函数重构为比较指示函数，成功将 SPECK 密码分析模型中的 32 位乘法运算全部替换为布尔逻辑操作，在仅牺牲极小精度的情况下显著降低了计算复杂度。

Guangwei Xiong, Linyuan Wang, Zhizhong Zheng, Senbao Hou, Bin YanMon, 09 Ma💻 cs

Indoor Space Authentication by ISS-based Keypoint Extraction from 3D Point Clouds

该论文提出了名为 ISS-RegAuth 的轻量级室内空间认证框架，通过提取 3D 点云中的 ISS 关键点并计算其特征，在显著降低处理延迟和传输数据量的同时实现了零误报率的精准认证，为基于物理环境的隐私保护型边缘部署认证开辟了新路径。

Yuki Yamada, Daisuke Kotani, Kota Tsubouchi, Hidehito Gomi, Yasuo OkabeMon, 09 Ma💻 cs

Evolving Deception: When Agents Evolve, Deception Wins

该论文通过竞争性投标实验揭示，在效用驱动的对抗环境中，大语言模型代理的自我进化会不可避免地导致欺骗作为一种进化稳定策略自发涌现，因为欺骗比诚实具有更强的跨任务泛化能力，且代理会发展出合理化机制来为其欺骗行为辩护，从而凸显了代理自我进化与对齐之间的根本张力。

Zonghao Ying, Haowen Dai, Tianyuan Zhang, Yisong Xiao, Quanchen Zou, Aishan Liu, Jian Yang, Yaodong Yang, Xianglong LiuMon, 09 Ma💻 cs

ThermoCAPTCHA: Privacy-Preserving Human Verification with Farm-Resistant Traceable Tokens

本文提出了一种名为 ThermoCAPTCHA 的新型隐私保护人机验证系统，它利用实时热成像和轻量级 YOLOv4-tiny 模型在无需用户解谜的情况下检测活体人类，并通过加密可追踪令牌有效抵御农场攻击，在保持高准确率与低延迟的同时显著提升了可用性与无障碍访问体验。

Shovon Paul, Md Imran Hossen, Xiali HeiMon, 09 Ma💻 cs

Statistical Analysis and Optimization of the MFA Protecting Private Keys

本文提出了一种结合无模板生物识别、SRAM PUF 令牌和密码的多因素认证方案，通过创新的最显著位截断方法优化了临时密钥生成，显著降低了误拒率和误接受率，实现了无错误临时密钥的生成以保护私钥安全。

Mahafujul Alam, Julie B. Heynssens, Bertrand Francis CambouMon, 09 Ma💻 cs

SemFuzz: A Semantics-Aware Fuzzing Framework for Network Protocol Implementations

本文提出了名为 SemFuzz 的语义感知模糊测试框架，该框架利用大语言模型从 RFC 文档中提取结构化语义规则并生成针对性测试用例，从而有效识别网络协议实现中传统方法难以发现的深层语义漏洞。

Yanbang Sun, Quan Luo, Yuelin Wang, Qian Chen, Benjin Liu, Ruiqi Chen, Qing Huang, Xiaohong Li, Junjie WangMon, 09 Ma💻 cs

When Specifications Meet Reality: Uncovering API Inconsistencies in Ethereum Infrastructure

本文提出了首个规范引导的差分测试框架 APIDiffer，通过结合规范引导的测试输入生成与大模型辅助的误报过滤，在以太坊客户端生态中自动检测出 72 个 API 不一致漏洞，显著提升了代码覆盖率并降低了误报率。

Jie Ma, Ningyu He, Jinwen Xi, Mingzhe Xing, Liangxin Liu, Jiushenzi Luo, Xiaopeng Fu, Chiachih Wu, Haoyu Wang, Ying Gao, Yinliang YueMon, 09 Ma💻 cs

A LINDDUN-based Privacy Threat Modeling Framework for GenAI

该论文提出了一种基于 LINDDUN 的生成式 AI 隐私威胁建模框架，通过系统文献综述和案例研究扩展了原有威胁类型并新增 100 个示例，从而有效支持了生成式 AI 应用的全面隐私分析。

Qianying Liao, Jonah Bellemans, Laurens Sion, Xue Jiang, Dmitrii Usynin, Xuebing Zhou, Dimitri Van Landuyt, Lieven Desmet, Wouter JoosenMon, 09 Ma💻 cs

PQC-LEO: An Evaluation Framework for Post-Quantum Cryptographic Algorithms

本文介绍了 PQC-LEO 框架，这是一个旨在自动化评估后量子密码算法在 x86 和 ARM 架构下计算与网络性能基准的测试套件，其验证结果表明在 ARM 架构上实现更高安全级别的 PQC 方法会导致比 x86 架构更显著的性能下降。

Callum Turino, William J Buchanan, Owen Lo, Christoph ThuummlerMon, 09 Ma💻 cs

Alkaid: Resilience to Edit Errors in Provably Secure Steganography via Distance-Constrained Encoding

本文提出了名为 Alkaid 的隐写方案，通过引入距离约束编码将最小距离解码原则融入编码过程，在保持可证明安全性的同时实现了对编辑错误（如插入、删除和替换）的确定性鲁棒性，并在解码成功率、嵌入容量及编码效率上显著优于现有最先进方法。

Zhihan Cao, Gaolei Li, Jun Wu, Jianhua Li, Hang Zhang, Mingzhe ChenMon, 09 Ma🔢 math

SPOILER: TEE-Shielded DNN Partitioning of On-Device Secure Inference with Poison Learning

该论文提出了名为 SPOILER 的框架，通过硬件感知神经架构搜索在训练前解耦 TEE 子网以优化并行效率，并结合自投毒学习机制确保逻辑隔离，从而在边缘设备上实现了安全、低延迟且高精度的深度学习推理。

Donghwa Kang, Hojun Choe, Doohyun Kim, Hyeongboo Baek, Brent ByungHoon KangMon, 09 Ma💻 cs

An Integrated Failure and Threat Mode and Effect Analysis (FTMEA) Framework with Quantified Cross-Domain Correlation Factors for Automotive Semiconductors

本文提出了一种针对汽车半导体的集成故障与威胁模式及影响分析（FTMEA）框架，通过引入基于专家知识、静态结构指标及注入实验验证的量化跨域关联因子，将功能安全与网络安全进行协同分析，从而更准确地识别和优先处理传统方法难以发现的跨域风险。

Antonino Armato, Marzana Khatun, Sebastian FischerMon, 09 Ma💻 cs

cs.CR