Molecular Representations for AI in Chemistry and Materials Science: An NLP Perspective
本文从自然语言处理(NLP)研究者的视角出发,综述了化学信息学中受 NLP 启发的主流分子表示方法及其在人工智能驱动的化学与材料科学中的应用,旨在为跨领域研究人员提供一份结构表示指南。
1002 篇论文
化学物理这一交叉领域探索着分子层面的物理规律,架起了化学变化与物理原理之间的桥梁。在这里,科学家通过理论模型和实验手段,深入理解原子如何结合、能量如何转化以及物质在微观尺度下的独特行为。
Gist.Science 致力于让 arXiv 上的最新研究成果触手可及。我们实时追踪并处理该分类下发布的所有预印本,为每一篇论文提供通俗易懂的科普解读与详尽的技术摘要,帮助不同背景的读者跨越专业术语的障碍,轻松把握前沿动态。
以下是该领域近期在 arXiv 上发布的最新论文精选。
本文从自然语言处理(NLP)研究者的视角出发,综述了化学信息学中受 NLP 启发的主流分子表示方法及其在人工智能驱动的化学与材料科学中的应用,旨在为跨领域研究人员提供一份结构表示指南。
本文主张通过整合人工智能与机器学习工作流、高通量实验及自驱动实验室,构建以催化剂设计、机理研究和反应工程为核心的数据驱动闭环生态系统,从而加速多类催化体系的发现与化学工艺工程的持续优化。
该论文首次将漂移模型引入分子构象生成,通过建立“漂移力恒等式”将物理力场融入生成过程,并发现其在坐标空间(FI)和距离特征空间(FK)中分别具有独特优势,从而实现了比传统分子动力学快百万倍、且兼具完美结构有效性与玻尔兹曼分布精度的单步采样。
该研究评估了 AI 工具 Boltz-2 在药物发现中的可靠性,发现尽管其预测速度极快,但在结合亲和力预测和结构收敛性方面表现不佳,缺乏 lead 识别所需的能量分辨率,因此仍需依赖基于物理的方法进行验证与优化。
本文提出并实验验证了名为 RESOLUTE 的协议,该协议通过结合 Ramsey 测量、关联光谱及相位循环技术,利用单量子传感器将有效相干时间从 0.38 微秒显著提升至 5.1 微秒,从而成功突破了传统限制,实现了对低至 50 kHz 频率信号的探测。
本文提出了一种受自编码器启发的构造性方法,通过结合密度泛函定理与解析约束在潜在空间中构建物理驱动的量子嵌入,从而为设计可解释且能涵盖基态、激发态及电荷转移态的机器学习原子间势函数奠定基础。
本文提出了一种基于部分信息分解(PID)的反应坐标分辨信息理论分析方法,通过将键不对称性坐标作为目标、DDEC6 净原子电荷作为源,成功解构了三个典型 S2 反应中化学键演化的冗余、独特及协同信息特征,揭示了反应对称性对信息分布的调控机制。
本文提出了 SAFT-P 理论,作为一种针对嵌段胶体自组装的斑块级微扰方法,通过引入斑块级关联并保留拓扑信息,成功克服了传统统计缔合流体理论在区分相同价数但不同斑块布局粒子及预测拓扑依赖相行为方面的局限。
该研究提出了一种结合实时含时密度泛函紧束缚方法与基于随机相位近似屏蔽相互作用的林德布拉德量子玻尔兹曼方程的新方法,系统揭示了银、金、铝纳米团簇中电子 - 电子散射导致的准粒子寿命、布居与相干动力学随能量及尺寸变化的规律,并阐明了量子尺寸效应及金 5d 带对弛豫过程的显著影响。
该研究通过整合分子动力学模拟、物理散射模型、贝叶斯模型判别及极化分析,首次成功解析了液态苯的各向异性旋转运动,解决了传统准弹性中子散射拟合中的歧义问题,为理解受限烃类催化中的分子动力学确立了新的分析范式。