原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明
想象你是一位厨师,正试图创造出世界上最好的新菜肴。你有一本食谱,里面收录了 20 道你已经测试过的食谱,并且你确切地知道它们的味道。你的目标是发明一道新食谱,其味道要比你食谱中最好的那道还要好。
然而,这里有一个陷阱:你不能对新想法进行试吃。 你处于一个“无试吃”区域。如果你猜错了,就无法回头修正;你只能希望你的猜测是正确的。这就是离线基于模型的优化所面临的挑战。
本文将通过结合老派的谨慎与未来的量子计算来解决这一问题。
问题:“过度自信”的厨师
过去,科学家试图通过构建一个“代理模型”——即味觉测试的数字孪生——来解决这个问题。他们利用这 20 道已知食谱训练该模型,然后让它猜测新食谱的味道会如何。
问题在于?这些模型往往过度自信。
- 类比: 想象一个只见过晴天的天气预报应用。如果你让它预测一个它从未见过的风暴区域的天气,它可能会自信地预测“晴天!”,因为它不知道更好的情况。
- 结果: 优化器选择了一道模型声称美味的“新食谱”,但实际上它很难吃。这被称为“模型利用”——诱骗系统认为一个糟糕的想法是极好的。
解决方案:“保守”的量子厨师
作者提出了一种名为COM-QEL的新方法。它结合了两个概念:
- 量子极值学习(QEL): 这使用量子计算机(具体为“参数化量子电路”)作为厨师的大脑。量子计算机就像超级计算器,能够比传统计算机更快、更具创造性地探索复杂的口味组合。它们非常擅长寻找美味的“巅峰”。
- 保守目标模型(COM): 这是“谨慎”的部分。它就像给量子大脑加了一个安全刹车。
“安全刹车”如何运作:
作者教导量子模型一条新规则:“如果你正在猜测一道你从未见过的食谱,请保持悲观。”
- 训练技巧: 在训练过程中,计算机会故意生成与食谱书中内容截然不同的“虚假”或“对抗性”食谱。
- 惩罚机制: 如果模型预测这些奇怪、虚假的食谱很美味,它就会受到惩罚。它学会了降低对任何看起来太陌生或不熟悉的事物的期望。
- 结果: 模型不再对狂野、未经测试的想法感到兴奋。相反,它专注于寻找那些基于已有知识可能是好的新食谱。它用一点点“狂野的新颖性”换取了更高的“可靠性”。
“秘密配料”:了解厨房布局
本文还介绍了一种巧妙的方法,用于处理成分以特定方式相互作用的复杂问题(例如盐如何影响酸,但不影响糖)。
- 类比: 想象你的厨房有两个独立的岛屿。一个岛屿用于烘焙(面粉、鸡蛋、糖),另一个用于烧烤(肉类、香料、火)。你不会把面粉和火混在一起。
- 创新: 作者使用了量子图神经网络(QGNN)。这是一种连接量子计算机的方式,使其能够尊重这些“岛屿”。它只允许代表烘焙成分的量子比特(qubits)相互对话,而代表烧烤成分的量子比特则相互对话。
- 结果: 通过尊重问题的自然结构,量子厨师找到了比将所有东西扔进一个大搅拌机更好的解决方案。
他们发现了什么?
研究人员在计算机模拟(合成基准)上测试了这种方法,涉及两种类型的挑战:
- 平滑函数(易地形): 就像一座缓坡。新方法(COM-QEL)找到了比旧量子方法(QEL)更好的解决方案,并且与最佳经典方法一样好,但选择糟糕解决方案的风险要小得多。
- 崎岖函数(难地形): 就像拥有许多山峰和深谷的山脉。在这里,旧量子方法经常因为过于兴奋而跌入深谷(糟糕的解决方案)。新方法则停留在安全的高地上。它找到的解决方案在“新颖性”上略逊一筹(与原始数据的距离较近),但实用得多(实际上味道很好)。
结论
该论文声称,通过结合量子计算(提供动力)与保守正则化(提供谨慎),他们创造了一种混合算法,当无法在现实世界中测试新事物时,该算法在设计新事物方面更加安全和可靠。
这就像给量子超级计算机系上“安全带”并配上“厨房地图”,确保它能找到最好的新食谱,而不会不小心端给你一碗木屑。
您所在领域的论文太多了?
获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。