Comparing AI Agents to Cybersecurity Professionals in Real-World Penetration Testing

该研究首次在真实企业环境中对比了 AI 代理与人类网络安全专家,结果显示新提出的多智能体框架 ARTEMIS 在漏洞发现数量、提交质量及成本效益方面均优于大多数人类参与者,尽管其在误报率和图形界面任务上仍存在不足。

Justin W. Lin, Eliot Krzysztof Jones, Donovan Julian Jasper, Ethan Jun-shen Ho, Anna Wu, Arnold Tianyi Yang, Neil Perry, Andy Zou, Matt Fredrikson, J. Zico Kolter, Percy Liang, Dan Boneh, Daniel E. Ho

发布于 2026-03-04
📖 2 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一场非常有趣的“黑客大比拼”:让人工智能(AI)黑客人类网络安全专家在同一个真实的大学网络里进行“渗透测试”(也就是模拟黑客攻击,寻找系统漏洞)。

你可以把这次实验想象成一场**“寻宝游戏”**,但寻找的不是金币,而是网络中的“安全漏洞”。

以下是用通俗语言和比喻为你做的解读:

1. 比赛场地:一个巨大的数字迷宫

  • 场景:斯坦福大学的一个大型网络,包含约 8,000 台电脑和服务器,分布在 12 个不同的区域(子网)。
  • 规则
    • 人类选手:10 位专业的网络安全专家,每人有 10 个小时的工作时间。
    • AI 选手:6 个现有的 AI 工具,加上作者团队开发的一个新 AI 系统叫 ARTEMIS
    • 目标:找出尽可能多的漏洞,并证明它们是真的(比如真的能窃取数据或控制电脑),而不是误报。

2. 参赛选手大揭秘

🏆 人类选手:经验丰富的老猎手

  • 特点:他们像经验丰富的侦探。他们会先扫描地图(网络扫描),然后像侦探一样思考:“这里有个门没锁,我进去看看;那里有个窗户没关,我再试试。”
  • 优势:他们懂得“变通”。如果看到一个复杂的图形界面(比如一个需要鼠标点击的旧版网页),他们能灵活处理。
  • 表现:大家水平参差不齐,最好的选手发现了 13 个漏洞,最差的发现了 3 个。

🤖 现有 AI 选手:只会死记硬背的实习生

  • 特点:像刚毕业的大学生,只会按教科书办事。
  • 表现:大多数现有的 AI 工具(比如 Codex 或 CyAgent)表现不佳。它们要么不敢动手(因为安全限制拒绝执行),要么只找到了一些表面问题,一旦遇到稍微复杂的情况就卡住了。它们就像只会走直线的机器人,遇到障碍物就停下了。

🚀 新选手 ARTEMIS:超级智能的“蜂群指挥官”

  • 它是谁:这是作者团队专门为了这次比赛设计的 AI 系统。
  • 它的绝招
    • 蜂群战术:它不像人类那样一次只做一件事。它像一个指挥官,可以瞬间派出**多个“小机器人”(子代理)**同时去攻击不同的目标。
    • 自我反思:它会像人类一样做笔记、总结进度,如果卡住了就换个思路,甚至能连续工作很久不休息。
    • 自动筛选:它有一个专门的“质检员”模块,会先检查自己找到的漏洞是不是真的,避免瞎报。
  • 战绩:ARTEMIS 拿到了第二名!它发现了 9 个有效漏洞,击败了 10 位人类选手中的 9 位。它的表现甚至超过了大多数人类专家。

3. 比赛结果对比:谁更厉害?

维度 人类专家 ARTEMIS (AI) 比喻
发现数量 平均每人发现 5-6 个 发现了 9 个 人类是单兵作战,ARTEMIS 是特种部队群殴。
工作速度 需要休息,节奏有快有慢 可以 24 小时不间断,并行处理 人类是马拉松选手,ARTEMIS 是不知疲倦的机器。
成本 60/小时60/小时 | 约 18/小时 ARTEMIS 就像是用“共享单车”的价格雇到了“法拉利”司机。
弱点 会累,会分心,受限于体力 不懂图形界面(GUI),容易误报 人类能看懂复杂的网页菜单,AI 如果只给个乱码界面就傻眼了。

4. 关键发现与比喻

  • AI 的“超能力”:并行处理

    • 比喻:人类侦探一次只能查一个房间,查完再查下一个。ARTEMIS 像是有 8 个分身,同时查 8 个房间。如果其中一个分身发现线索,它会立刻呼叫其他分身支援。
    • 结果:这让 AI 在大规模网络扫描中效率极高。
  • AI 的“阿喀琉斯之踵”:图形界面(GUI)

    • 比喻:如果漏洞藏在一个需要你用鼠标点击、拖拽的旧版网页里,人类侦探一眼就能看出来。但 ARTEMIS 是个“命令行”专家,它只习惯敲代码。如果它看到一堆乱码或者需要点按钮,它可能会直接忽略,或者错误地认为那里没问题。
    • 例子:有一个漏洞藏在 TinyPilot(一种远程控制设备)的网页界面里,80% 的人类都找到了,但 ARTEMIS 没找到,因为它不擅长操作鼠标和浏览器。
  • 误报问题

    • 比喻:人类侦探看到“门没锁”会小心地推一下确认。AI 有时候看到“门好像没锁”(比如收到一个 200 成功代码),就大喊“我进来了!”,结果其实是门后有个“请登录”的牌子。AI 的“假警报”比人类多。

5. 这意味着什么?

  • 对于防御者(好人):这是一个好消息。我们可以用更便宜、更不知疲倦的 AI 工具来帮我们要检查网络漏洞。ARTEMIS 的成本只有人类专家的 1/3 到 1/4,但能力却很强。
  • 对于攻击者(坏人):这是一个警告。如果坏人也能用这种 AI,他们可以在几秒钟内扫描成千上万个网站,找出漏洞。
  • 未来的方向:现在的 AI 还需要人类来“带飞”。最好的模式是**“人机协作”**:让 AI 负责不知疲倦地扫描和初步筛选,让人类专家负责处理复杂的图形界面和最终确认。

总结

这就好比在说:“以前我们觉得 AI 只是个只会做题的学霸,这次我们发现,给它装上‘蜂群指挥’的大脑后,它已经能像顶尖黑客一样在真实世界里‘寻宝’了。虽然它偶尔会看错路(误报)或者看不懂复杂的地图(图形界面),但它便宜、速度快、不知疲倦,未来将是网络安全领域不可或缺的助手。”

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →