SCiMS: Sex Calling in Metagenomic Sequences
本文介绍了 SCiMS 这一生物信息学工具,它利用贝叶斯分类器分析宏基因组数据中的宿主染色体读段密度比,能够在宿主 DNA 含量极低的情况下跨物种准确预测宿主性别,从而有效解决微生物组研究中性别元数据缺失或错误的问题。
1250 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文介绍了 SCiMS 这一生物信息学工具,它利用贝叶斯分类器分析宏基因组数据中的宿主染色体读段密度比,能够在宿主 DNA 含量极低的情况下跨物种准确预测宿主性别,从而有效解决微生物组研究中性别元数据缺失或错误的问题。
这项研究通过对来自 8 个国家的 12 个婴儿队列进行荟萃分析,揭示了婴儿肠道病毒组在生命头三年遵循快速且可预测的演替轨迹,表现为病毒丰富度增加、群落收敛性增强以及功能基因向稳定状态的转变,从而为识别疾病相关的病毒组扰动提供了基准框架。
该研究提出了一种名为 DEFT 的新方法,通过结合蛋白质语言模型预测 EC 号前两级与结构比对预测后两级的策略,显著提高了肠道细菌粘蛋白 O-糖苷酶等酶类功能分类的准确性与高通量基因组注释效率。
该论文针对多输入生物关联预测中因度比率捷径导致的评估偏差问题,提出了一种实体平衡评估框架及模型无关的 UnbiasNet 训练策略,旨在消除捷径信号干扰,实现对药物 - 靶标相互作用及药物协同效应等任务更公正、鲁棒的性能评估与关联预测。
该研究评估了 95 种零样本模型,发现尽管它们在预测单点突变和非上位性突变组合时表现良好,但无法准确预测强上位性突变组合对蛋白质性质和功能的影响,从而揭示了当前最先进模型在捕捉复杂突变相互作用方面的不足。
本研究通过诱导人多能干细胞分化为透明软骨样组织,发现人类特异性长链非编码RNA在软骨发育中显著上调并调控细胞外基质相关基因,为改善软骨再生质量及解析人类特有疾病机制提供了新见解。
该研究提出了一种基于前缀的基因组降采样方法,通过构建 k-mer 频率矩阵并结合集成学习模型,在显著降低数据维度的同时实现了高效的细菌表型预测,为轻量级基因组语言模型的发展提供了新路径。
本文提出了一种名为 PIGLET 的新型图 Transformer 方法,通过构建包含结合口袋相似性、蛋白互作及药物相似性的蛋白质组知识图谱来预测药物 - 靶标相互作用,并在更严格的药物划分基准测试及真实案例中展现出优于现有深度学习模型的性能。
KG-Orchestra 是一个开源的多智能体框架,它通过结合检索增强生成(RAG)与多智能体协作机制,自动从稀疏种子图构建出具有高粒度、可追溯证据支持且具备因果关系的生物医学知识图谱,从而有效平衡了知识构建的规模性与准确性。
本研究通过整合计算生物学方法构建了布鲁氏菌(*Brucella melitensis*)IV 型分泌系统的结构模型,并基于虚拟筛选从 DrugBank 数据库中鉴定出依折麦布、氯氮卓和阿洛因三种潜在的老药新用候选药物,为开发针对布鲁氏菌病的抗毒力疗法提供了新策略。