这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明
Each language version is independently generated for its own context, not a direct translation.
想象一下,你拥有一个非常聪明的机器人,它可以查看一张手写数字(例如"7")的图片,并准确告诉你它是什么。这个机器人是一个量子机器学习模型,是我们当今所用人工智能的超级高级版本。
然而,就像人类会被魔术戏法愚弄一样,这个机器人也可能被欺骗。攻击者可以在图片上添加一层微小且不可见的“静态”或“噪声”。在你的眼中,"7"看起来仍然像"7",但机器人却突然认为它是"2"。这被称为对抗性攻击。
本文的作者希望为这个机器人构建一道盾牌,使其不再受骗。以下是他们如何实现这一点的简明解释:
旧式盾牌的缺陷
通常,要教会机器人忽略这些戏法,你必须向它展示成千上万张被篡改的假图片,并告诉它:“这仍然是 7,不要被愚弄!”这被称为对抗性训练。
- 难点:有时你无法这样做。也许你并不知道攻击者会使用何种戏法,或者也许机器人变得如此擅长识别某一种特定的戏法,以至于它忘记了如何处理新的戏法。这就像只为某一种特定类型的数学考试而学习,当题目稍有变化时便考试不及格。
新解决方案:“量子自编码器”(魔法过滤器)
作者没有重新训练机器人,而是构建了一个量子自编码器(QAE)。你可以将其想象为图像的高科技照片滤镜或降噪耳机。
- 过滤器:在机器人查看图片之前,QAE 会接收图像(即使是带有不可见噪声的图像),并尝试“重构”它。
- 净化:QAE 仅在干净、完美的图片上进行训练。当它看到带有噪声的被篡改图片时,它会尝试剥离奇怪的噪声,并根据其对“真实”图片样貌的认知重建图像。这就像一位修复师清洗一幅沾满泥浆的画作,以揭示其下方的原始艺术。
- 结果:随后,机器人查看这个经过清理的版本。由于噪声已消失,机器人可以再次正确识别出"7"。
“置信度计”(守门员)
有时,噪声过于强烈,以至于过滤器无法完美清理图片。如果机器人试图对一张杂乱的图片进行猜测,它仍可能出错。
为了解决这个问题,作者添加了一个置信度计。这就像俱乐部里一位严格的守门员:
- 检查:系统会检查两件事:
- 过滤器清理图片的效果如何?(噪声是否消失了?)
- 机器人有多确定?(机器人是确信这是"7",还是在猜测?)
- 决策:如果图片仍然过于杂乱,或者机器人不确定,守门员会说:“禁止入内!”并拒绝该样本。它不会做出错误的猜测;它只是拒绝回答,这比撒谎要好。
他们的发现
该团队在著名的图像数据集上测试了这种方法(用于数字的 MNIST 和用于服装的 FashionMNIST)。
- 结果:当攻击者使用强烈的戏法来愚弄机器人时,旧方法(使用标准计算机过滤器)惨败,准确率降至接近零。
- 胜利:他们的新系统(QAE++)保持了机器人的正常工作。在某些情况下,与现有最佳方法相比,它将机器人的准确率提高了68%。
- 效率:他们的量子过滤器也比旧的计算机过滤器更小、更轻量,运行所需的内存要少得多。
简而言之
该论文提出了一种保护量子人工智能免受欺骗的方法,而无需针对每一种可能的戏法对其进行重新训练。他们使用量子过滤器来清理图像,并使用置信度计来拒绝任何看起来过于可疑的内容。这使得人工智能即使在有人试图混入不可见的噪声以混淆它时,也能保持准确和可靠。
您所在领域的论文太多了?
获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。