想象一下,你正试图烤制完美的蛋糕,但你的原料不是面粉和糖,而是“等离子体处理”和“化学清洗”等无形的微观工艺过程。你希望蛋糕口感恰到好处(即具备正确的电学特性),但每次烘烤都耗资巨大,而且烤箱每次的表现都略有不同。
这正是制造氮化镓(GaN)晶体管(电子器件中使用的微型功率开关)的工程师们所面临的挑战。他们需要找到完美的配方,却无法承担烘烤成千上万个蛋糕来测试每一种变体的成本。
以下是本文作者如何利用传统数学与新颖的“量子”魔法相结合来解决这一问题的。
1. 问题:昂贵且嘈杂的厨房
在现实世界中,制造这些晶体管充满了混乱。清洗或加热过程中的微小变化会导致器件性能发生巨大改变。
- 数据难题:你无法在计算机上完美地模拟这一过程,因为现实世界过于混乱。你必须实际制造芯片才能获取数据。
- 成本:他们仅拥有来自468 个芯片的数据。在人工智能(AI)领域,这是一个极小、几乎可以忽略不计的数据集。通常,AI 需要数百万个示例才能有效学习。面对如此少的样本,标准 AI 模型往往会“死记硬背”噪声而非学习实际规律,从而导致预测结果糟糕。
2. 解决方案:混合“量子 - 经典”厨师团队
该团队构建了一种新型 AI,称为混合经典 - 量子神经网络(HQNN)。不妨将其想象为一个双人烹饪团队:
- 经典主厨(人类):这部分 AI 如同标准计算机。它接收杂乱的食谱指令(24 个不同变量,如温度、时间和化学试剂类型),并将它们整理成简单易懂的摘要。
- 量子副厨(魔法):这是新颖的部分。它接收上述摘要,并将其送入“量子电路”。想象这是一个神奇的香料研磨机,能够以普通研磨机无法实现的方式混合风味。它利用量子物理的奇特规则(如叠加态和纠缠态),在数据中发现人类主厨遗漏的隐藏模式。
3. 他们如何测试
他们并非凭空猜测哪种“量子香料研磨机”最佳。他们构建了19 种不同的设计(模板)并全部进行了测试,就像尝试不同形状的饼干模具,看看哪种能做出最好的饼干。
他们发现:
- 适度增加复杂度有益:拥有更多可调节“旋钮”(参数)和更多混合层(深度)的电路表现更好。
- “金发姑娘”区域:如果量子电路过于复杂(过于随机),表现反而变差。这就像将搅拌机调至“最大混乱”模式来搅拌蛋糕面糊——结果只会是一团糟。最佳的电路复杂度足以发现模式,但又不至于混乱到迷失方向。
- 更优的工具:使用“可调节”混合工具(参数化门)的电路,比使用“固定”工具(静态门)的电路表现更佳。
4. 结果:更优的配方
当他们将新的混合厨师与标准 AI(“经典基线”)进行比较时,混合厨师胜出。
- 得分:它将总体误差降低了24.4%。
- 具体优势:
- 它更准确地预测了“开/关”开关行为。
- 它在预测漏电流(开关关闭时泄漏的电量)方面表现尤为出色。这通常是最难预测的,因为它对微小的制造误差极其敏感。
- 它更准确地预测了“迟滞”(开关记忆的变化)。
5. “噪声”测试:它在真实量子计算机上能运行吗?
当今的真实量子计算机是“嘈杂”的——它们会出错,就像带有静电干扰的收音机。该团队模拟了这种噪声,以观察其模型是否会崩溃。
- 发现:即使存在中等程度的“静电”(噪声),该模型依然表现优异。只有当噪声极高时,它才开始遇到困难。
- 启示:这表明我们不需要完美、未来的量子计算机就能使用这种方法。我们完全有可能在当下可用的那些小型、不完美的量子计算机上运行此方法。
总结
该论文表明,通过将标准计算机与小型专用量子电路相结合,工程师们能够学会制造更优质晶体管的“秘密配方”,即使他们仅拥有少量昂贵的数据。这就像使用魔法透镜,在普通肉眼会忽略的模糊照片中看清模式,从而帮助他们更快、更廉价地构建更优质的电子产品。
技术摘要:用于 recessed-gate AlGaN/GaN MIS-HEMTs 多特性协同优化的混合经典 - 量子神经网络
问题陈述
优化 recessed-gate AlGaN/GaN 金属 - 绝缘体 - 半导体高电子迁移率晶体管(MIS-HEMTs)需要对多个耦合电学特性进行精确建模。这些器件对工艺诱导的变异性(例如,沟槽深度、介电层成分、表面处理)非常敏感,而解析模型若要不牺牲精度或效率,则无法捕捉这些变异。尽管机器学习(ML)已成为半导体建模的标准,但经典方法在处理实验数据集时往往力不从心。这些数据集生成成本高昂、规模固有较小,且由于制造随机性而充满噪声。稠密经典网络在此类数据上经常发生过拟合,或无法同时捕捉工艺变量与多个耦合器件目标(阈值电压、滞后、亚阈值摆幅、导通/关断电流)之间复杂的非线性关联。
方法论
作者提出了一种混合经典 - 量子神经网络(HQNN)框架,旨在对来自 24 维制造/工艺向量的六个电学目标进行联合优化。该方法包括:
- 数据集:本研究利用了分布在 17 个不同工艺分割中的 468 个实验制造器件。输入向量包含连续变量(晶圆坐标、几何尺寸)和二进制独热编码的分类工艺选择(清洗、等离子体处理、介电层沉积、退火)。预测的六个目标为:正向/反向阈值电压(Vth,fwd, Vth,rev)、滞后(ΔVth)、亚阈值摆幅(SS)、导通电流(Ion)和关断电流(Ioff)。
- 架构:HQNN 采用“严格瓶颈”设计,其中经典多层感知机(MLP)编码器将 24 维输入压缩为 4 维潜在代码。该代码被映射为 4 量子比特参数化量子电路(PQC)的旋转角度。PQC 通过变分层处理状态,3 轴泡利测量(X, Y, Z)产生 12 维特征向量,该向量被线性映射到六个目标。
- 电路设计与筛选:作者系统地筛选了源自 Sim 等人 [18] 的 19 种量子电路模板家族,变化了连接性(最近邻、全对全)、纠缠门类型(CNOT, CRZ, CRX)和电路深度(L)。他们评估了“单模板”(重复一个块)和“顺序混合电路”(堆叠不同块)的假设(ansatzes)。
- 训练:模型使用加权多目标均方误差(MSE)损失进行训练。量子参数的梯度通过参数移位规则计算,并结合 CUDA-Q 和 PyTorch 通过编码器和读出层集成经典反向传播。
主要贡献
- 系统性电路筛选:该工作提供了用于半导体回归的量子电路模板的大规模消融研究,确定了与性能相关的具体架构属性。
- 多目标协同优化:与以往常依赖主成分分析(PCA)压缩或单目标回归的量子核方法不同,该 HQNN 在完整特征向量上执行端到端监督学习,以同时预测多个耦合器件指标。
- 设计指导:该研究建立了电路属性(表达能力、参数数量、深度、纠缠器类型)与预测精度之间的相关性,为小数据问题的假设选择提供了框架。
结果
选定的 HQNN 被标识为L=2 时的电路 (13, 5)(一种混合电路配置,在第 1 层使用模板 13,在第 2 层使用模板 5),并与包括 ANN、PLS、决策树、XGBoost 等在内的经典基线进行了基准测试。
- 性能提升:与最佳经典基线(ANN)相比,HQNN 将整体归一化均方根误差(nRMSE)降低了24.4%。
- 特定目标改进:
- Vth,fwd RMSE:0.297 V → 0.270 V
- Vth,rev RMSE:0.278 V → 0.263 V
- ΔVth RMSE:0.049 V → 0.045 V
- SS RMSE:22.22 mV/dec → 19.87 mV/dec
- Ioff RMSE:5.75×10−8 A → 4.35×10−8 A(约 24% 的降低)
- Ion RMSE 保持竞争力(0.053 A 对比 ANN 的 0.056 A)。
- 消融洞察:
- 表达能力:精度与表达能力(DKL)呈负相关。高表达能力(类似 Haar 随机)的电路表现较差,这可能是由于小数据 regime 中的 barren plateaus( barren 平台)所致。
- 参数与深度:精度与参数数量、电路深度和双量子比特门数量呈正相关。
- 纠缠器:参数化受控旋转门(CRZ, CRX)的表现优于静态 CNOT 基电路。
- 噪声鲁棒性:对代表性电路(模板 13,L=4)进行的去极化噪声研究表明,在轻度噪声(p=0.005)下,模型保持了 0.905 的整体 R2。虽然 Ioff 预测对噪声敏感,但与电压相关的目标保持稳定,这表明即使量子表示退化,经典编码器仍保留预测能力。
意义与主张
该论文声称将半导体建模中的量子机器学习(QML)从单目标量子核回归推进到针对 recessed-gate GaN MIS-HEMTs 的多特性器件建模。作者断言,变分混合量子模型可以在经典机器学习受限的小规模、含噪实验数据集上改善泛化能力。
该工作表明,鉴于其已证明的对轻度去极化噪声的鲁棒性,类似的 HQNN 可能在近期量子硬件(特别是 4 量子比特寄存器)上可训练或可部署。该研究为未来 QML 辅助的半导体工艺优化提供了电路设计框架,强调受控的假设选择对于在实际的、数据受限的工程任务中实现量子优势至关重要。
每周获取最佳 applied physics 论文。
受到斯坦福、剑桥和法国科学院研究人员的信赖。
请查收邮箱确认订阅。
出了点问题,再试一次?
无垃圾邮件,随时退订。