Before You Hand Over the Wheel: Evaluating LLMs for Security Incident Analysis

本文针对安全事件分析(SIA)中缺乏严格基准评估的难题,提出了首个名为 SIABENCH 的代理评估框架,该框架包含涵盖深度分析与告警分类的 160 个场景数据集及自主执行多类取证任务的智能体,并据此对 11 种主流大语言模型进行了系统性基准测试。

Sourov Jajodia, Madeena Sultana, Suryadipta Majumdar, Adrian Taylor, Grant VandenbergheMon, 09 Ma💻 cs

Hiding in Plain Sight: A Steganographic Approach to Stealthy LLM Jailbreaks

该论文提出了名为 StegoAttack 的框架,利用隐写术将恶意查询嵌入语义连贯的良性段落中,成功解决了现有越狱方法在语义隐蔽性与语言自然性之间的权衡难题,并在包括 GPT-5 和 Gemini-3 在内的四种先进大模型上实现了高达 95.50% 的攻击成功率,同时显著降低了被检测的风险。

Jianing Geng, Biao Yi, Zekun Fei, Ruiqi He, Lihai Nie, Tong Li, Zheli LiuFri, 13 Ma🤖 cs.AI

WebWeaver: Breaking Topology Confidentiality in LLM Multi-Agent Systems with Stealthy Context-Based Inference

本文提出了 WebWeaver 攻击框架,通过仅 compromising 单个任意代理并利用基于上下文的隐蔽推理机制(包括新型隐蔽越狱和免越狱扩散设计),在无需控制管理代理的情况下高效且隐蔽地推断大语言模型多智能体系统的通信拓扑,从而显著突破了现有防御并大幅提升了推断准确率。

Zixun Xiong, Gaoyi Wu, Lingfeng Yao, Miao Pan, Xiaojiang Du, Hao WangFri, 13 Ma🤖 cs.AI

DNS-GT: A Graph-based Transformer Approach to Learn Embeddings of Domain Names from DNS Queries

本文提出了 DNS-GT,一种基于 Transformer 的图学习方法,通过自监督预训练从 DNS 查询序列中学习域名嵌入,有效解决了现有方法对标注数据的过度依赖及上下文信息利用不足的问题,并在域名分类和僵尸网络检测任务中取得了优于基线的性能。

Massimiliano Altieri, Ronan Hamon, Roberto Corizzo, Michelangelo Ceci, Ignacio SanchezFri, 13 Ma🤖 cs.LG

Security-by-Design for LLM-Based Code Generation: Leveraging Internal Representations for Concept-Driven Steering Mechanisms

该论文提出了一种名为 SCS-Code 的轻量级模块化机制,通过利用代码大语言模型内部对安全概念的细粒度表征来引导生成过程,从而在保持功能正确性的同时显著提升了生成代码的安全性,并超越了现有最先进方法。

Maximilian Wendlinger, Daniel Kowatsch, Konstantin Böttinger, Philip SperlFri, 13 Ma🤖 cs.LG