想象一下,你正在尝试为一种新型蛋糕寻找完美的配方,但你有两位截然不同的厨师在负责这项工作。厨师 A 擅长分析蛋糕的结构(它蓬松吗?它有分层吗?),而厨师 B 则擅长品尝风味(它够甜吗?它湿润吗?)。
在传统实验室中,这两位厨师在不同的房间里工作。厨师 A 烤好一批蛋糕,将其送往实验室进行分析,等待报告出炉,然后才告诉厨师 B 下一步该烤什么。厨师 B 也是如此:烤制、送检品尝、等待,然后才告诉厨师 A。这种模式非常缓慢,就像必须等上一封信寄到后,才能寄出下一封信。
本文介绍了一种名为**MAD(多仪器自主发现)**的新系统,它就像一位超级高效的“厨房经理”,让两位厨师能够同时工作,实时协作,并持续分享他们所学到的内容。
以下是其工作原理,使用简单的类比来说明:
1. 问题:“观望等待”的瓶颈
通常,科学家必须收集完所有数据后,才能开始做出明智的决策。这就像试图在拿到盒子上所有拼图碎片之前,甚至都不看一眼盒子上的图案,就试图解开谜题。这需要数天甚至数周的时间。此外,“结构”机器(X 射线衍射仪)和“电学”机器(电阻测试仪)产生的数据往往互不沟通,尽管它们正在观察同一种材料。
2. 解决方案:“共享大脑”
MAD 系统将两台不同的机器(一台 X 射线机和一台电学测试仪)连接到一台中央计算机上。这台计算机充当共享大脑。
- 设置:他们正在测试一种"Mn-Sb-Te"材料(锰、锑和碲的混合物),该材料正被探索用于相变存储器(PCM)。可以将 PCM 想象成一种超快速、可重复写入的数字存储芯片。
- 魔法技巧:该系统使用一种称为多输出模型的数学工具。想象这是一个翻译器,它既能理解“结构语言”,也能理解“电学语言”。它意识到原子的排列方式(结构)直接影响电流的流动(功能)。
3. 他们如何“阅读”蛋糕
X 射线机产生的复杂图案看起来像杂乱的涂鸦。为了理解这些图案,系统使用了一种称为**NMF(非负矩阵分解)**的技术。
- 类比:想象 X 射线图案是一杯由不同水果混合而成的冰沙。NMF 就像一台机器,它能品尝这杯冰沙,并告诉你其中草莓、香蕉和猕猴桃的确切含量,即使你看不到水果块。
- 在本文中,这杯“冰沙”就是材料的晶体结构。系统将结构分解为 7 种基本“风味”(或相),并告诉你样本中每种相所占的百分比。
4. “实时”发现循环
系统不再等待,而是运行在一个闭环中:
- 测量:两台机器对材料上的一个点进行测试。
- 翻译:中央计算机立即将杂乱的 X 射线数据转换为“相百分比”,并将其与电阻数据结合起来。
- 决策:计算机问道:“我们接下来应该看哪里?”
- 对于 X 射线机,它会寻找那些在结构上不确定的点(以了解更多关于“配方”的信息)。
- 对于电学机器,它会寻找可能具有最高电阻的点(即最佳的“风味”)。
- 重复:它立即将机器移动到这些新点。
5. 结果:速度与洞察
本文声称,这种方法既极快又极其智能:
- 速度:他们仅用25 步(迭代)就找到了最佳的材料成分,并绘制了整个结构图。传统方法需要逐个检查每一个点,这将花费数天时间。而 MAD 仅用了约5 小时。这意味着速度提升了七倍。
- 更好的决策:由于“结构”和“电学”数据在相互沟通,系统学习得更快。它不仅找到了一种好材料,还弄清楚了为什么它是好的。
- 发现:他们发现,特定的原子排列(一种“三方”结构)是使该材料作为存储器件良好工作的关键。他们确定了一种特定的配方(Mn28Sb52Te20),该配方在其“关闭”状态下具有最高的电阻,这对于存储芯片至关重要。
总结
可以将 MAD 视为科学家的副驾驶。与其盲目驾驶并在旅程结束后才查看地图,不如让副驾驶同时观察道路(结构)和引擎性能(电学),实时操控汽车,从而比以前更快地找到最佳目的地。
本文总结道,这种“多仪器自主发现”框架允许实验室并行运行实验,而不是按缓慢的顺序进行,从而使发现新材料(例如用于更快计算机内存的材料)的过程变得更加迅速和高效。
技术摘要:实时多仪器自主发现新型相变存储器材料
问题陈述
自主实验室(AE)通过整合自动化执行、分析与决策,彻底变革了材料科学。然而,在整合来自多种仪器的多样化异构数据流方面,仍存在显著瓶颈。传统方法往往依赖实验完成后的数据分析,或独立运行各仪器,未能在实时实验过程中利用跨属性相关性。此外,由于混合相区域普遍存在、非平衡相的出现,以及结构表征(如 X 射线衍射)相较于功能测量耗时更长,在复杂系统中学习“合成 - 工艺 - 结构 - 性能关系”(SPSPR)极具挑战性。现有的 CAMEO 或 SAGE 等框架虽试图弥合结构与性能之间的鸿沟,但通常将相图绘制与性能优化视为顺序或独立任务,缺乏闭环系统内的实时双向知识共享。
方法论:多仪器自主发现(MAD)框架
作者提出并展示了 MAD 框架,这是一个旨在同步执行结构性能映射与功能性能优化的闭环系统。该框架应用于 Mn-Sb-Te(MST)三元体系,这是一个此前未被探索的相变存储器(PCM)材料空间。
- 实验设置:通过共溅射制备了两个成分相同的薄膜库。其中一个薄膜库经过退火处理以进行结构表征(XRD),而另一个保持非晶态以进行电阻测量。这些设备通过客户端 - 服务器模型连接到中央服务器,允许从 X 射线衍射仪和接触式探针台进行异步数据采集。
- 数据融合与建模:
- 非负矩阵分解(NMF):XRD 图谱被分解为一组非负基分量(端元)和丰度系数。这种无监督方法将聚类问题转化为连续回归形式,在不依赖离散标签的情况下捕捉混合相特征。基于元素、二元和三元相的假设,选定了七个分量。
- 共区域化高斯过程(GP):采用共区域化核的多输出 GP 模型被用于合并 NMF 衍生的相丰度与电阻数据。该模型将结构和功能属性视为“多任务”问题,通过共享潜在空间来模拟它们之间的相关性。
- 决策制定:系统在主动学习循环中为每个任务利用不同的采集函数:
- 探索(XRD):使用最大不确定性(MU)以最大化对晶体结构分布的认知。
- 利用(电阻):使用期望提升(EI)来识别具有最大电阻(Ramorphous)的成分,这是 PCM 的关键性能指标。
- 工作流程:中央控制器执行联合推断,以预测结构和功能属性。随后,它根据各自的采集函数为每个仪器独立选择下一个实验点,同时底层 GP 模型更新其共享知识库。
主要贡献
- 实时多仪器集成:本文展示了首个多仪器 AE 系统的实时实施,其中结构和功能数据流被实时融合以指导决策,而非依赖事后分析。
- 共享潜在表示:通过使用带有 NMF 衍生丰度的共区域化 GP,该框架实现了双向信息流。结构数据为性能预测提供信息,而性能数据则完善结构理解,克服了独立模型或顺序策略的局限性。
- 连续相图映射:与将相视为离散标签的方法不同,MAD 将晶体结构表示为连续的混合相丰度。这使得能够模拟平滑过渡和混合相区域,提供了对 SPSPR 更符合物理实际的表示。
- 效率:与传统的网格映射和独立 GP 方法相比,该框架在发现最佳材料和绘制相界方面的速度提高了七倍。
结果
- 性能:在对 MST 库(177 种成分)的实时实验中,MAD 仅通过约 42 次测量就确定了最佳材料成分,并重构了具有 95% 相似度(余弦相似度评分)的 XRD 图谱。最佳电阻成分在 25 次迭代内被发现。
- 基准测试:计算机模拟基准测试表明,贝叶斯优化(BO)引导的共区域化核在重构精度(更低的动态时间规整分数)和优化收敛性(更小的最小遗憾距离)方面,均显著优于独立 GP 和随机采样。
- 材料发现:该研究确定了 Mn28Sb52Te20为具有最大非晶电阻的成分,而 Mn14Sb43Te43则产生了最大的电阻对比度。分析将观察到的相变行为与三方 MnSb2Te4结构联系起来,并识别出与该相相关的特定 NMF 分量(C0、C2)。
- 相关性分析:该框架成功提取了特定相分量与电阻之间的相关性,揭示了某些相(如 C6)与高电阻(绝缘行为)呈正相关,而其他相(如 C5)则与导电行为相关。
意义与主张
作者主张,MAD 框架通过实现并行、协作式实验而非独立、顺序式操作,为大规模自主设施开辟了新路径。通过共享潜在空间整合结构和功能数据,该系统不仅加速了收敛,还通过捕捉相分布与功能属性之间的内在关系,改进了材料协同设计标准。论文指出,这种方法对于具有平滑变化的功能属性和复杂混合相区域的系统尤为有利,在这些系统中,传统的离散标签方法可能会失效。在 MST 系统上的成功演示突显了发现新型磁性拓扑绝缘体和室温磁性 PCM 的潜力,为未来的研究提供了专注的平台。作者对当前的实施保持谦逊,指出虽然 NMF 在当前模型中被视为理想情况,但未来的工作可以纳入贝叶斯 NMF 以实现完整的量化不确定性,并采用多智能体架构以进一步缓解吞吐量瓶颈。
每周获取最佳 applied physics 论文。
受到斯坦福、剑桥和法国科学院研究人员的信赖。
请查收邮箱确认订阅。
出了点问题,再试一次?
无垃圾邮件,随时退订。