原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明
想象一下,你正在尝试教计算机预测一种新材料将如何表现——例如它能阻挡多少电流(带隙),或者在什么温度下会失去磁性(居里温度)。
通常,为了教计算机,人类科学家必须充当翻译。他们需要将化学式(如"Fe2O3")手动转化为一串计算机能理解的数字列表(描述符)。他们可能会说:“嘿,这含有铁,所以我们加一个代表铁原子量的数字”,或者“这含有氧,所以我们加一个代表其大小的数字”。这被称为特征工程,就像人类厨师在烹饪前手动切好每一种蔬菜。这需要大量时间,要求深厚的专业知识,而且有时厨师会错过完美的食材。
本文介绍了AUTOMAT,这是一个新系统,其中的 AI 智能体充当厨师,但它不仅仅是遵循食谱,而是自己发明食谱。
“自主研究者”厨师
将 AUTOMAT 想象为一位非常聪明、不知疲倦且精通编程的研究助理。它的任务是找出将化学式转化为计算机学习用数字列表的最佳方法。
以下是其工作原理,使用一个简单的类比:
- 目标:AI 被赋予一个目标:“预测无机材料的带隙”。它被告知只能使用化学式(不能使用晶体结构或外部数据库)。
- 循环(烹饪周期):
- 构思:AI 写下一条笔记(一个名为
idea.md的文件)来解释其理论。例如,“我认为如果我们计算原子间‘磁强度’的差异,计算机的学习效果会更好。” - 代码:随后,它编写实际执行该计算的计算机代码。
- 试味:它使用标准的“试味”方法(随机森林模型,这是一种可靠且简单的 AI 类型)运行测试。它会检查:“我新生成的数字列表是否提高了预测的准确性?”
- 决策:
- 如果预测结果变好,AI 会保留新的数字列表,并继续下一个构思。
- 如果结果变差,AI 会将该构思扔进垃圾桶,并回退到上一个“良好”的列表。
- 构思:AI 写下一条笔记(一个名为
- 护栏:为了防止 AI 只是生成包含百万个随机数字的列表(这会令计算机困惑),系统设有一个“保留”测试集。这就像一场 AI 直到最后都看不到的秘密考试。AI 只被允许保留那些能帮助它通过模拟考试的更改,但最终决定使用哪份数字列表,取决于它在秘密考试中的表现。
他们发现了什么?
研究人员在两道特定的“菜肴”上测试了这位 AI 厨师:
- 带隙:预测材料阻挡多少光。
- 居里温度:预测磁铁何时失去磁性。
他们将 AI 自行生成的数字列表与人类生成的列表(使用“魔比”(Magpie)等标准方法或简单的“分数组成”)进行了比较。
结果:
- AI 获胜:在这两种情况下,自主 AI 创建的数字列表都比人类创建的列表产生了更准确的预测。
- AI 理解了化学:AI 并没有只是随机抛出数字。它发现了真正的化学家都知道很重要的概念。
- 对于带隙,AI 意识到“氧化态”(原子的带电情况)和“电荷平衡”至关重要。它是自己得出这一结论的。
- 对于磁铁,AI 意识到磁性元素(如铁和钴)的具体混合方式以及它们与稀土元素的相互作用是关键。
- 无需人类帮助:AI 在没有人类告诉它要计算什么的情况下完成了这一切。它只知道目标和规则,并自行解决了其余部分。
局限性(烤焦的面包)
该论文诚实地指出了 AI 仍然挣扎的地方:
- 它变得贪婪:AI 有时会不断向列表中添加更多数字,认为“越多越好”,即使这开始使数据变得杂乱无章。它需要人类告诉它:“好了,别再添加食材了,菜已经做好了。”
- 它重复自己:有时 AI 会以不同形式添加它已经拥有的数字,比如分别添加“盐”和“钠”。这不是最高效的烹饪方式,但仍然有效。
- 它需要停止按钮:AI 不知道何时自行停止;它需要人类说:“我们已经尝试得够多了,让我们看看结果吧。”
核心结论
这篇论文表明,我们可以构建一个 AI 智能体,它不仅能使用数据,还能设计数据呈现给其他 AI 的方式。这就像赋予计算机发明自己的词汇来描述世界的能力,而不是强迫它使用我们设计的语言。
对于材料科学而言,这意味着我们很快将拥有 AI 助手,它们能够迅速找出预测新材料属性的最佳方法,从而为科学家节省数年的手动试错时间。AI 不仅找到了更好的答案;它还找到了向数据提出的更好的问题。
您所在领域的论文太多了?
获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。