Improving AlphaFold3 by Engineering MSA and Template Inputs
本文通过系统性地工程化设计与优化多序列比对(MSA)及模板输入,显著提升了 AlphaFold3 在蛋白质单体、多聚体及蛋白 - 配体复合物结构预测中的精度,并首次证明在同等定制化输入条件下 AlphaFold3 的表现优于 AlphaFold2。
1235 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文通过系统性地工程化设计与优化多序列比对(MSA)及模板输入,显著提升了 AlphaFold3 在蛋白质单体、多聚体及蛋白 - 配体复合物结构预测中的精度,并首次证明在同等定制化输入条件下 AlphaFold3 的表现优于 AlphaFold2。
该研究首次系统解析了 AlphaFold 3 的内在机制,揭示其预测精度主要依赖于进化多样性而非序列深度,通过将弥散的共进化信息压缩为包含线性生物物理特征和可操控置信度的紧凑潜在空间,从而利用多序列比对定位结构约束并激活权重中存储的结构先验。
该研究提出了一种基于差异变化方向性的网络整合框架,通过量化不同数据集间蛋白质上调与下调的一致性,成功将异质性的蛋白质组数据整合为具有生物学意义的网络,揭示了乳腺癌中脂质与胆固醇相关通路的富集特征。
本文提出了 SCIGMA,一种可扩展、通用且具备不确定性感知能力的深度学习框架,通过引入不确定性感知对比学习目标和多视图图神经网络,成功实现了跨多种模态、平台及百万级空间位点的高维空间多组学数据整合,并在多项基准测试中展现出优于现有方法的性能。
本文提出了 CHORD 框架,通过联合学习基因、细胞和细胞类型的表示,实现了跨物种单细胞数据的整合,能够推断保守的细胞类型层级关系、支持未知细胞类型检测,并揭示基因功能与发育连续变异。
本文提出了名为 LinkD 的统一多尺度药物重定位框架,该框架通过整合基于扩散模型的靶点亲和力预测、熵感知选择性评分、大规模细胞表型验证及真实世界电子健康记录证据,并配备交互式 AI 代理,成功实现了从分子到临床层面的系统性药物发现与验证。
BioEngine 是一个可部署于多种计算环境的执行与适配层,旨在通过代理可读接口弥合生物图像基础模型与可扩展算力之间的鸿沟,使生物学家能够仅通过自然语言描述即可轻松筛选、微调及部署 AI 模型。
本文介绍了 PEACE 模型,该模型通过结合 ProtTrans 序列嵌入与原型感知对比学习,有效解决了病原真菌和卵菌效应子预测中的类别不平衡问题,并在保持高召回率的同时显著提升了预测精度。
本文提出了一种名为 GTStrDTI 的结构感知图注意力分层 Transformer 框架,通过结合图内注意力与跨模态注意力机制,有效整合药物分子与靶标蛋白的 3D 结构特征,从而在冷启动等挑战性场景下显著提升了药物 - 靶标结合亲和力的预测性能。
该研究提出了一种基于智能体搜索的排序策略,在抗菌肽候选药物优先级排序任务中,其从数千个虚拟筛选结果中精准捕获高价值候选分子的能力显著优于传统加权求和、NSGA-II 及随机权重搜索等方法,并提供了可无缝集成至内部研发流程的开源工具。