生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。

作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。

以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。

DIANA: Deep Learning Identification and Assessment of Ancient DNA

本文介绍了 DIANA,一种基于深度学习的多任务神经网络,它通过分析组装单元序列丰度,能够高精度地预测古代宏基因组样本的宿主、群落类型和材料等元数据,并具备将未见过的样本(如新亚种)泛化归类至其父级类别的能力,从而为古代微生物组研究提供了一种快速、数据驱动的元数据验证与质量控制工具。

Duitama Gonzalez, C., Lopopolo, M., Nishimura, L., Faure, R., Duchene, S.2026-04-10💻 bioinformatics

Divergent landscapes of positive and negative selection signatures across residue-resolved human-virus protein-protein interaction interfaces

该研究通过整合人类 - 病毒蛋白质相互作用图谱与残基接触信息,揭示了病毒靶向宿主蛋白界面中正负选择压力的空间组织模式,发现正选择位点倾向于在模拟宿主内源相互作用的界面中形成显著的空间聚类,从而阐明了适应性进化与功能约束在分子层面的复杂平衡机制。

Su, W.-C., Xia, Y.2026-04-10💻 bioinformatics

CoPhaser: generic modeling of biological cycles in scRNA-seq with context-dependent periodic manifolds

本文介绍了 CoPhaser,一种基于生物信息变分自编码器的算法,它通过学习上下文依赖的周期性流形,成功将单细胞转录组数据中的周期性生物过程(如细胞周期、昼夜节律等)与细胞身份及其他变异源解耦,从而在多种生物学场景中实现了高精度的周期相位重建并揭示了新的生物学机制。

Paychere, Y., Salati, A., Gobet, C., Naef, F.2026-04-09💻 bioinformatics

Quaternion Spectral Fingerprinting of DNA: GPU-Accelerated Multi-Channel Fourier Analysis for Alignment-Free Genomics

该研究提出了一种基于四元数傅里叶变换的 GPU 加速无比对基因组分析方法,通过双复数 FFT 高效计算全谱指纹,不仅揭示了传统功率谱无法检测的 DNA 螺旋重复等结构周期性特征,还实现了跨物种的通用性验证及人类全基因组在消费级硬件上的秒级实时分析。

Bergach, M. A.2026-04-09💻 bioinformatics

End-to-end evaluation of pipelines for metagenome-assembled genomes reveals hidden performance gaps

本文介绍了 MAG-E 框架,通过模拟人类肠道微生物组环境对宏基因组组装基因组(MAG)全流程进行端到端基准测试,揭示了不同组装与分箱工具的性能差异、多样本分箱与精炼策略的局限性,以及现有质量评估工具在完整性与污染度评估上的系统性偏差。

Coleman, I., Ma, J., Qian, G., Jiang, Y., Brown Kav, A., Korem, T.2026-04-09💻 bioinformatics

IEKB: a comprehensive knowledge base for inner ear genetics integrating curated associations, cochlear interactions, Bayesian candidate prioritisation, explainable dark-gene support relations, and a scientific entity network

本文介绍了内耳知识库(IEKB),这是一个开放数据库,通过自动化辅助人工审校流程整合了内耳基因与表型的 curated 关联、耳蜗相互作用证据、基于贝叶斯的候选基因优先排序、可解释的暗基因支持关系以及多实体科学网络,旨在为内耳遗传学研究提供统一的资源。

Wang, H., Chen, W., Ning, H., Cai, Y., Xu, Y., Hou, X., Pang, L., Luo, Z., Tian, C.2026-04-09💻 bioinformatics