Molecular Fingerprints Are Strong Models for Peptide Function Prediction
该研究通过在 132 个数据集上的实验证明,基于简单分子指纹的轻量级模型在肽功能预测任务中表现优于复杂的图神经网络和 Transformer 模型,从而挑战了必须建模长程相互作用才能准确预测肽性质的传统假设。
19 篇论文
该研究通过在 132 个数据集上的实验证明,基于简单分子指纹的轻量级模型在肽功能预测任务中表现优于复杂的图神经网络和 Transformer 模型,从而挑战了必须建模长程相互作用才能准确预测肽性质的传统假设。
本文提出了名为 IFACE 的框架,通过概率耦合内在几何与空间化学场来对齐蛋白质表面,从而构建了一种能够更有效地区分构象变异与结构分歧、并揭示功能相关相互作用位点的统一几何 - 化学距离度量。
该研究提出了一种源自原子基础模型中间特征的新型局部蛋白质环境表示方法,该方法不仅能有效捕捉结构与化学特征,还能构建数据驱动的先验分布,并成功实现了具有物理学信息且达到最先进精度的核磁共振化学位移预测。
CryoNet.Refine 是一种基于单步扩散模型的深度学习框架,它通过整合密度感知损失函数与立体化学约束,实现了比传统方法更快速、自动化且高质量的冷冻电镜结构模型优化。
该论文提出了“反向蒸馏”框架,通过将大模型表示分解为由小模型引导的正交子空间,构建出具有嵌套结构的嵌入,从而解决了蛋白质语言模型缩放性能不佳的问题,使其在相同维度下能持续超越小模型并达到最佳性能。
该研究提出了一种基于热力学度量的统一框架,通过从序列中学习低维表示,无需依赖自由能或相共存数据即可定量预测无序蛋白在复杂混合物中的分配行为及多组分相图。
本文提出了 BInD,一种基于知识引导的扩散模型,通过协同生成分子及其与靶标蛋白的相互作用,有效解决了现有结构药物设计模型难以平衡多种优化目标的局限,实现了在靶标特异性相互作用、分子性质及局部几何结构上的全面优异表现。
该论文提出了一种名为 QCAI 的新颖事后解释方法,用于量化 Transformer 解码器中的交叉注意力交互,并通过构建包含 274 个实验测定结构的 TCR-XAI 基准测试,证明了其在 TCR-pMHC 结合预测准确性与可解释性方面均达到了最先进水平。
本文提出了一种受 SamplingDesign 启发的基于采样的连续优化框架,通过迭代采样候选序列并利用黑盒指标更新参数化分布,在多种 mRNA 设计目标上(特别是未配对概率和可及尿苷百分比)实现了优于现有方法的性能,并支持多目标权衡与扩展。
该研究通过蒙特卡洛模拟表明,蛋白质 YibK 的热稳定性(熔点 Tm)与其拓扑状态无关,实验与计算结果之间的差异源于深结蛋白中解结与去折叠过程的时间尺度显著分离,导致 DSC 实验测得的 Tm 实际上反映了非平衡态分布。
该研究通过建立精确解析理论并辅以模拟,揭示了在纳米丝束的熵分离过程中,仅由排除体积半径与系绳长度之比这一无量纲参数决定其是相互排斥还是出现反常的吸引亚稳态,从而挑战了熵力必然导致解聚的传统观点。
该研究通过蒙特卡洛模拟证实,蛋白质中的拓扑结能显著提升其动力学稳定性(即抗去折叠能力),且这种稳定性随结的深度和序列复杂性增加而增强,表明动力学稳定性可能是驱动结蛋白在进化中得以保留的关键功能优势。
该论文通过第一性原理分析揭示了古 DNA 保存的复杂性并批判了传统二分类方法的偏差,进而提出了 HSF 后验溯源框架,通过以片段为基本单位、最大化来源多样性及结合保存特征评估,显著提升了混合信号样本中古 DNA 的真实性鉴定与来源判别能力。
本文提出了 HEroBM,一种基于深度等变图神经网络的通用方法,能够高效、准确地将任意粗粒度分子构象回映射为全原子结构,并成功应用于复杂的生物体系。
这篇综述文章探讨了原子分子动力学模拟在揭示 RNA 构象动态及其与离子、小分子和蛋白质相互作用方面的最新进展,强调了增强采样和整合方法对提升结构系综精度的作用,并展望了人工智能在加速 RNA 建模与模拟中的新兴角色。
该论文提出了一种通用的推理时优化框架,通过优化潜在表示和结合结构先验与力场先验的采样方案,有效解决了现有生成模型在产生符合实验数据的蛋白质构象集合时存在的采样局限与热力学不合理问题,显著提升了多样性、物理合理性及与实验数据的吻合度,并揭示了当前设计指标在扰动嵌入时可能人为虚增置信度的漏洞。
FLOWR.root 是一种基于流匹配的 SE(3) 等变基础模型,能够联合进行结构感知的 3D 配体生成与多终点亲和力预测,并通过参数高效微调实现领域适应,从而为从先导化合物发现到优化的结构药物设计提供全面支持。
该研究通过荧光偏振竞争结合实验精确测定了转录因子 Klf4 的体外结合能,并证明结合线性模型与伊辛模型(Ising model)的统计力学框架,能够仅凭体外数据准确预测 Klf4 在单分子及全基因组范围内的结合占据情况。
本文提出了 Cryo-SWAN,这是一种受多尺度小波分解启发的体素变分自编码器,旨在通过条件粗到细的潜在编码和递归残差量化,实现对分子密度体积中全局几何与高频细节的精准表征,从而推动结构生物学和体积成像领域的 AI 应用。