Defending Quantum Classifiers against Adversarial Perturbations through Quantum Autoencoders

本文提出了一种无需对抗训练的量子分类器防御框架,该框架利用量子自编码器净化对抗样本并识别无法清洗的输入,在对抗攻击下的预测准确率方面显著优于现有最先进方法。

原作者: Emma Andrews, Sahan Sanjaya, Prabhat Mishra

发布于 2026-05-01
📖 1 分钟阅读🧠 深度阅读

这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

想象一下,你拥有一个非常聪明的机器人,它可以查看一张手写数字(例如"7")的图片,并准确告诉你它是什么。这个机器人是一个量子机器学习模型,是我们当今所用人工智能的超级高级版本。

然而,就像人类会被魔术戏法愚弄一样,这个机器人也可能被欺骗。攻击者可以在图片上添加一层微小且不可见的“静态”或“噪声”。在你的眼中,"7"看起来仍然像"7",但机器人却突然认为它是"2"。这被称为对抗性攻击。

本文的作者希望为这个机器人构建一道盾牌,使其不再受骗。以下是他们如何实现这一点的简明解释:

旧式盾牌的缺陷

通常,要教会机器人忽略这些戏法,你必须向它展示成千上万张被篡改的假图片,并告诉它:“这仍然是 7,不要被愚弄!”这被称为对抗性训练。

  • 难点:有时你无法这样做。也许你并不知道攻击者会使用何种戏法,或者也许机器人变得如此擅长识别某一种特定的戏法,以至于它忘记了如何处理新的戏法。这就像只为某一种特定类型的数学考试而学习,当题目稍有变化时便考试不及格。

新解决方案:“量子自编码器”(魔法过滤器)

作者没有重新训练机器人,而是构建了一个量子自编码器(QAE)。你可以将其想象为图像的高科技照片滤镜降噪耳机

  1. 过滤器:在机器人查看图片之前,QAE 会接收图像(即使是带有不可见噪声的图像),并尝试“重构”它。
  2. 净化:QAE 仅在干净、完美的图片上进行训练。当它看到带有噪声的被篡改图片时,它会尝试剥离奇怪的噪声,并根据其对“真实”图片样貌的认知重建图像。这就像一位修复师清洗一幅沾满泥浆的画作,以揭示其下方的原始艺术。
  3. 结果:随后,机器人查看这个经过清理的版本。由于噪声已消失,机器人可以再次正确识别出"7"。

“置信度计”(守门员)

有时,噪声过于强烈,以至于过滤器无法完美清理图片。如果机器人试图对一张杂乱的图片进行猜测,它仍可能出错。

为了解决这个问题,作者添加了一个置信度计。这就像俱乐部里一位严格的守门员:

  • 检查:系统会检查两件事:
    1. 过滤器清理图片的效果如何?(噪声是否消失了?)
    2. 机器人有多确定?(机器人是确信这是"7",还是在猜测?)
  • 决策:如果图片仍然过于杂乱,或者机器人不确定,守门员会说:“禁止入内!”并拒绝该样本。它不会做出错误的猜测;它只是拒绝回答,这比撒谎要好。

他们的发现

该团队在著名的图像数据集上测试了这种方法(用于数字的 MNIST 和用于服装的 FashionMNIST)。

  • 结果:当攻击者使用强烈的戏法来愚弄机器人时,旧方法(使用标准计算机过滤器)惨败,准确率降至接近零。
  • 胜利:他们的新系统(QAE++)保持了机器人的正常工作。在某些情况下,与现有最佳方法相比,它将机器人的准确率提高了68%
  • 效率:他们的量子过滤器也比旧的计算机过滤器更小、更轻量,运行所需的内存要少得多。

简而言之

该论文提出了一种保护量子人工智能免受欺骗的方法,而无需针对每一种可能的戏法对其进行重新训练。他们使用量子过滤器来清理图像,并使用置信度计来拒绝任何看起来过于可疑的内容。这使得人工智能即使在有人试图混入不可见的噪声以混淆它时,也能保持准确和可靠。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →