生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。

作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。

以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。

anndataR improves interoperability between R and Python in single-cell transcriptomics

该论文介绍了 anndataR 包,它通过支持在 R 中直接读写 HDF5 格式的 AnnData 文件、实现与 SingleCellExperiment 或 Seurat 对象的转换以及确保跨语言兼容性,显著提升了单细胞转录组学数据在 R 和 Python 生态之间的互操作性。

Deconinck, L., Zappia, L., Cannoodt, R., Morgan, M., scverse core,, Virshup, I., Sang-aram, C., Bredikhin, D., Seurinck, R., Saeys, Y.2026-03-08💻 bioinformatics

An Improved Dataset for Predicting Mammal Infecting Viruses from Genetic Sequence Information

该研究通过构建包含最新文献证据且规模翻倍的标准化哺乳动物病毒宿主数据集,评估了多种机器学习模型在预测病毒宿主感染方面的性能,发现扩大宿主分类层级(如哺乳动物)和减少训练集与测试集间的系统发育距离能显著提升预测准确率,但在跨病毒科预测时模型表现接近随机水平,表明病毒宿主预测在缺乏共同祖先的情况下难以实现良好的泛化。

Reddy, T., Schneider, A., Hall, A. R., Witmer, A., Hengartner, N.2026-03-08💻 bioinformatics

MiRformer: A Unified Generative Framework for mRNA-Conditioned miRNA Synthesis and Interaction Prediction

本文提出了 MiRformer,这是一种基于双 Transformer 编码器和滑动窗口注意力机制的统一生成框架,能够直接从原始序列中学习长 mRNA 上下文中的 miRNA 相互作用模式,在实现高精度结合位点定位与降解位点识别的同时,生成具有生物学意义的靶标特异性 miRNA 序列。

Gu, J., Chen, C., Li, Y.2026-03-08💻 bioinformatics

REMAG: recovery of eukaryotic genomes from metagenomic data using contrastive learning

REMAG 是一款利用对比学习(结合 HyenaDNA 基础模型、Siamese 网络和 Barlow Twins 损失函数)从长读长宏基因组数据中高效回收高质量真核生物基因组组装(MAGs)的新工具,有效解决了现有流程因依赖原核参考数据库而难以处理真核生物基因组的问题。

Gomez-Perez, D., Raguideau, S., Warring, S., James, R., Hildebrand, F., Quince, C.2026-03-08💻 bioinformatics

Telomere-to-telomere assembly and haplotype analysis of tetraploid Dendrobium officinale illuminate Orchidaceae polyploid evolution and mycorrhizal symbiosis genes

本研究完成了兰花科首个端粒到端粒(T2T)水平的四倍体石斛基因组组装与单倍型解析,揭示了其约 86 万年前的四倍化事件,并阐明了 SWEET 基因家族在附生适应及菌根共生中的关键作用。

Chen, E., Xu, J., Liu, Y., Li, Y., Feng, Y., Lu, Q., Ding, X., Niu, Z., Qin, S., Niu, S., Luo, Y., Guo, X., Luo, X.2026-03-07💻 bioinformatics