生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。

作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。

以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。

CROWN: Curated Repository Of Well-resolved Noncovalent interactions

本文介绍了 CROWN,这是一个通过自动化预处理流程(包含独特的能量最小化步骤)从 PLInder 数据库中构建的大规模、高质量且多样化的蛋白质 - 配体相互作用数据集,旨在解决现有数据在结构可靠性与覆盖范围之间的权衡问题,并为机器学习模型训练提供以几何结构为核心的无偏资源。

Poelmans, R., Van Eynde, W., Bruncsics, B., Bruncsics, B., Arany, A., Moreau, Y., Voet, A. R.2026-04-01💻 bioinformatics

geneslator: an R package for comprehensive gene identifier conversion and annotation

本文介绍了 geneslator,一个旨在解决现有工具在数据一致性和工作流碎片化方面局限性的 R 语言包,它通过统一八种模式生物的基因标识符转换、同源基因映射及通路注释,为高通量测序数据的整合与功能分析提供了精确且可复现的框架。

Cavallaro, G., Micale, G., Privitera, G. F., Pulvirenti, A., Forte, S., Alaimo, S.2026-04-01💻 bioinformatics

STAPLE: automating spatial transcriptomics analysis and AI interpretation

STAPLE 是一个模块化框架,通过整合空间转录组分析流程、统一数据结构并引入 AI 驱动的报告层,实现了从细胞分型到通讯分析的全自动、可重复且具备生物学解释性的端到端分析。

Lvovs, D., Quinn, J., Forjaz, A., Santana-Cruz, I., Stapleton, O., Vavikolanu, K., Wetzel, M., Data Science Hub TeamLab,, Demystifying Pancreatic Cancer Therapies TeamLab,, Pagan, V. B., Herb, B. R. (…)2026-04-01💻 bioinformatics

Accurate detection of mosaic mutations at short tandem repeats from bulk sequencing data

该研究提出了名为 BulkMonSTR 的计算框架,通过结合 STR 特异性误差建模与机器学习分类,实现了从批量测序数据中高精度检测体细胞嵌合短串联重复序列突变,显著优于现有方法并为研究衰老和疾病中的 STR 突变贡献提供了可扩展的基础。

Wang, W., Li, W., Wang, C., Fan, W., Xia, Y., Yang, X., Chu, C., Dou, Y.2026-04-01💻 bioinformatics