FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching
本文提出了 FragFM,一种基于片段级离散流匹配的层次化分子生成框架,通过结合粗粒度到细粒度的自编码器与随机片段包策略,实现了高效、可扩展且具备优异属性控制能力的分子生成,并引入了针对天然产物生成的 NPGen 基准以验证其在药物发现中的优越性能。
1002 篇论文
化学物理这一交叉领域探索着分子层面的物理规律,架起了化学变化与物理原理之间的桥梁。在这里,科学家通过理论模型和实验手段,深入理解原子如何结合、能量如何转化以及物质在微观尺度下的独特行为。
Gist.Science 致力于让 arXiv 上的最新研究成果触手可及。我们实时追踪并处理该分类下发布的所有预印本,为每一篇论文提供通俗易懂的科普解读与详尽的技术摘要,帮助不同背景的读者跨越专业术语的障碍,轻松把握前沿动态。
以下是该领域近期在 arXiv 上发布的最新论文精选。
本文提出了 FragFM,一种基于片段级离散流匹配的层次化分子生成框架,通过结合粗粒度到细粒度的自编码器与随机片段包策略,实现了高效、可扩展且具备优异属性控制能力的分子生成,并引入了针对天然产物生成的 NPGen 基准以验证其在药物发现中的优越性能。
本文提出了一种贝叶斯分层建模框架,通过量化性能指标及其不确定性,对 500 个分子系统中的鞍点搜索算法进行了严谨评估,发现共轭梯度法(CG)整体鲁棒性优于 L-BFGS,且移除外部旋转虽增加计算成本但可能提升 L-BFGS 的可靠性,从而支持构建自适应的“方法链”工作流程。
该论文提出了一种名为 LOREM 的图神经网络架构,通过引入等变电荷进行长程消息传递,有效解决了现有截断图方法难以捕捉静电、色散及电子离域等长程物理效应的局限,并在无需针对特定数据集调整超参数的情况下实现了卓越的基准性能。
该论文提出了一种基于数据驱动的结构保持(辛且时间可逆)映射来学习机械作用量的方法,从而在分子动力学模拟中实现大时间步长积分,有效消除了非结构保持机器学习预测器导致的能量不守恒等病理行为,并具备在不同热力学条件和化学组分间迁移的能力。
本文介绍了 metatensor 和 metatomic 两个基础软件库,旨在通过提供统一的数据存储、模型接口及跨语言(如 Python 与 Fortran/C/C++)互操作性,解决原子尺度机器学习中数学基础与软件生态不兼容的挑战,从而促进该技术在模拟领域的广泛应用。
本文提出了张量原子团簇展开(TACE)方法,通过在笛卡尔空间中利用不可约笛卡尔张量分解局部环境,统一了标量与张量建模,实现了无需克莱布希 - 高登系数的频域与空域高效计算,并展示了其在分子、材料、光谱、外场响应及多保真度训练等广泛场景中的高精度、稳定性与通用性。
该研究利用 pCCD 方法计算发现,在咔唑基有机染料桥接单元中引入氮原子(尤其是三氮掺杂)能显著增强从给体到受体的定向电荷转移效率,其中三氮掺杂体系表现出高达 42.6% 的转移率,是染料敏化太阳能电池的极具潜力的候选材料。
该论文提出了一种基于置换校正均方根偏差(RMSD)的二维投影方法,结合高斯过程能量插值,将高维反应路径映射为可视化的能量曲面,从而克服了传统一维轨迹分析的局限性,实现了对不同优化历史及复杂反应路径的有效比较与验证。
该研究通过在经典处理器上模拟容错量子硬件执行迭代量子耦合簇(iQCC)算法,成功计算了铱和铂有机金属化合物的激发态能量,结果显示其精度优于现有经典方法,从而确立了约 200 个逻辑量子比特是实现计算化学量子优势的临界阈值。
该论文提出了一种结合输入凸神经网络与半定规划的半定机器学习框架,通过从分子数据中学习两电子约化密度矩阵(2-RDM)的顶点边界近似,在无需显式构建高阶正性条件的情况下,显著提升了直接变分计算 2-RDM 的精度,使其结果与完全活性空间组态相互作用(CASCI)高度一致。