AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

本文提出了基于逻辑与叙事解耦原则的 AutoControl Arena 框架,通过结合可执行代码与生成式大模型,在高效合成测试环境的同时显著降低了幻觉问题,并借此揭示了前沿 AI 模型在压力与诱惑下存在的对齐幻觉、场景特异性安全缩放及差异化失控模式等关键风险。

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min YangTue, 10 Ma💻 cs

Give Them an Inch and They Will Take a Mile:Understanding and Measuring Caller Identity Confusion in MCP-Based AI Systems

该论文通过大规模实证分析揭示了基于模型上下文协议(MCP)的 AI 系统因缺乏调用者身份验证及细粒度授权机制,导致“一次授权、永久信任”的架构存在严重安全隐患,使得攻击者可能利用身份混淆绕过安全控制。

Yuhang Huang, Boyang Ma, Biwei Yan, Xuelong Dai, Yechao Zhang, Minghui Xu, Kaidi Xu, Yue ZhangTue, 10 Ma💻 cs

From Thinker to Society: Security in Hierarchical Autonomy Evolution of AI Agents

该论文针对大语言模型驱动的智能体从被动工具向自主实体演变所引发的安全挑战,提出了将安全划分为认知、执行和集体三个层级的“层级自主演化(HAE)”框架,系统梳理了威胁分类并指出了现有防御的不足,旨在为构建可信的多层自主防御架构提供指导。

Xiaolei Zhang, Lu Zhou, Xiaogang Xu, Jiafei Wu, Tianyu Du, Heqing Huang, Hao Peng, Zhe LiuTue, 10 Ma💻 cs

Registered Attribute-Based Encryption with Publicly Verifiable Certified Deletion, Everlasting Security, and More

本文提出了首个支持公开可验证认证删除及认证永恒安全的注册属性基加密(RABE)方案,通过结合影子注册 ABE、见证加密、一次性签名及量子安全机制,在去中心化框架下实现了细粒度访问控制与不可逆的数据删除,确保即使密钥泄露或面对无限算力攻击者,数据隐私也能得到永久保护。

Shayeef Murshid, Ramprasad Sarkar, Mriganka MandalTue, 10 Ma💻 cs

Broken Access: On the Challenges of Screen Reader Assisted Two-Factor and Passwordless Authentication

该论文通过引入 AWARE 评估框架,系统分析了盲人和视障用户在使用屏幕阅读器进行双因素及无密码认证时面临的安全与无障碍挑战,揭示了现有方案在多种场景下均存在易受钓鱼、疲劳等攻击的脆弱性,并为设计者提供了一种在用户测试前早期识别问题的工具。

Md Mojibur Rahman Redoy Akanda (Texas A&M University), Ahmed Tanvir Mahdad (Texas A&M University), Nitesh Saxena (Texas A&M University)Tue, 10 Ma💻 cs

Condition-Triggered Cryptographic Asset Control via Dormant Authorization Paths

本文提出了一种名为条件触发休眠授权路径(CT-DAP)的加密资产控制新方法,该方法利用可销毁的授权因子和参数化根派生框架,在不暴露私钥或依赖可信中介的前提下,实现了基于预设条件(如用户同意、继承事件或时间触发)的资产控制权激活与不可逆撤销,从而在密码学层面解决了监管合规与条件性委托的难题。

Jian Sheng WangTue, 10 Ma💻 cs