Per-residue optimisation of protein structures: Rapid alternative to optimisation with constrained alpha carbons
本文提出了一种名为 PROPTIMUS RAPHAN 的蛋白质结构逐残基优化方法,通过将结构划分为重叠子结构进行独立优化,实现了计算时间随结构规模线性增长,并验证了结合 GFN-FF 力场的实现方案在显著缩短耗时的同时,能达到与约束α碳优化相当的结构质量。
1244 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文提出了一种名为 PROPTIMUS RAPHAN 的蛋白质结构逐残基优化方法,通过将结构划分为重叠子结构进行独立优化,实现了计算时间随结构规模线性增长,并验证了结合 GFN-FF 力场的实现方案在显著缩短耗时的同时,能达到与约束α碳优化相当的结构质量。
本文提出了名为 ARIES 的新算法,利用蛋白质语言模型生成的氨基酸嵌入和窗口互反加权相似度指标,实现了在低同源性区域表现更优且具备线性扩展能力的快速、高精度多序列比对。
本文介绍了 scprocess,这是一个专为 10x Genomics 技术生成的百万级单细胞数据而设计的 Snakemake 自动化流程,旨在通过统一的命令行接口解决大规模数据集在管理、效率及可重复性方面的挑战,实现从原始测序文件到标准化分析结果的端到端处理。
该研究通过开发基于表达量的注释策略,构建了标准化的人类小 Vault RNA(svtRNAs)注释资源,实现了对其在多种细胞系中的系统性检测与定量,并揭示了其作为人类小 RNA 景观中丰富且具潜在调控功能的重要组分。
该研究利用 90 对配对样本构建了真实变异与 FFPE 伪变异的基准数据集,并提出了一种基于可解释提升机(EBM)的新型过滤工具 FIFA,通过引入局部上下文特征显著提升了 FFPE 样本中体细胞突变伪影的过滤性能,从而有效增强了利用海量 FFPE 存档样本进行回顾性癌症基因组学研究的能力。
EnsAgent 是一种基于多智能体工具集成的空间转录组学自动注释框架,它通过解耦结构分区与语义标注、引入多模型共识及多专家反馈机制,显著提升了复杂组织微环境注释的鲁棒性、准确性与可解释性。
本文介绍了"Descriptron-GBIF Annotator",这是一款基于浏览器的零安装众包工具,利用 AI 辅助和受控词汇表对来自 GBIF 的生物多样性图像进行形态学标注,旨在通过公民科学模式加速结构化形态数据的生成,并与专业工作平台形成互补反馈循环以应对生物多样性危机。
本文介绍了 STEVE,这是一个旨在通过集成子采样评估、新细胞类型检测和基准测试等模块,系统性量化单细胞转录组数据中细胞类型注释准确性、鲁棒性及可重复性的综合评估框架。
该研究通过整合分析五个公共数据集的 1068 个心脏组织样本,利用多组学计算方法鉴定出一种可重复的免疫 - 纤维化转录特征,揭示了铁死亡相关基因 HMOX2 作为核心致病机制,并构建了一个具有高诊断效能的九基因生物标志物面板。
本文介绍了 MOSAICField,这是一种利用深度神经网络进行非线性形变场估计的统一框架,能够整合多模态空间组学数据,实现跨切片物理对齐与形态结构映射,从而构建高精度的三维组织模型并提升多模态分析能力。