Uncovering Latent Structure in Gliomas Using Multi-Omics Factor Analysis
本研究利用多组学因子分析(MOFA)整合基因组、表观基因组和转录组数据,揭示了胶质瘤亚型间的分子异质性并发现了具有预后价值的新生物标志物,为制定更个性化的治疗策略提供了依据。
1248 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本研究利用多组学因子分析(MOFA)整合基因组、表观基因组和转录组数据,揭示了胶质瘤亚型间的分子异质性并发现了具有预后价值的新生物标志物,为制定更个性化的治疗策略提供了依据。
该研究通过分析卵巢癌患者的单细胞测序数据中的双细胞(doublets),揭示了治疗抵抗患者中 M2 型巨噬细胞诱导 T 细胞耗竭、而治疗敏感患者中 M1 型巨噬细胞维持 T 细胞活性的物理相互作用机制,并指出这种 T 细胞 - 巨噬细胞相互作用可能影响化疗疗效。
本文提出了名为 LLMsFold 的计算框架,通过整合大型语言模型生成候选分子与基于物理的扩散模型(Boltz-2)进行结构预测及强化学习优化,实现了针对 ACVR1 和 CD19 等致病蛋白的从头药物设计。
该论文通过将科学方法论形式化为包含程序工作流、完整性纪律和项目治理的三阶段门控协议,使通用语言模型能够在跨学科研究中生成可审计、证据充分且具备生物学验证能力的严谨成果,并证实了该约束机制在降低研究风险方面的有效性。
该研究开发了 Cross-DB Genomic Comparator (CDGC) 工具,通过系统比对发现病毒参考基因组在不同数据库中高度一致,而真菌基因组存在显著差异及潜在的技术缺陷,从而强调了跨数据库基准测试对于提升微生物参考基因组准确性和统一性的重要性。
该研究在 TCGA-BRCA 数据集上对比了两种从病理全切片图像预测通路富集的方法,发现直接预测通路富集比先预测基因表达再推断富集的方法表现更优,为优化癌症预测模型提供了新方向。
本文介绍了 PopGenAgent,一个面向群体基因组学的报告导向型工作流系统,它通过将经过验证的工具链模板与可追溯的执行流程相结合,并利用分层语言模型辅助参数配置与报告生成,显著降低了分析脚本编写与协调的门槛,同时确保了研究结果的可复现性与可解释性。
该论文提出了一种名为 EPERep 的进化输入增强策略,通过利用未注释序列构建基于预训练语言模型的进化谱,显著提升了机器学习模型对远缘同源蛋白及稀有功能类别的功能预测准确性。
本文介绍了 ViroSeek,这是一款专为二代测序数据设计的轻量级、可复现且易于使用的病毒检测生物信息学流程,通过自动化执行质量控制、宿主序列去除、组装及分类等步骤,实现了对病毒组的高效、准确分析。
本文介绍了 MiGenPro,这是一种基于链接数据和机器学习的计算工作流,能够利用已注释的微生物基因组数据高效预测其表型特征(如运动性、革兰氏染色反应等),并具备高鲁棒性、可解释性及良好的互操作性。