生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。

作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。

以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。

Probabilistic coupling of cellular and microenvironmental heterogeneity by masked self-supervised learning

本文提出了基于 Transformer 的掩码自监督学习框架 Mievformer,通过编码邻近细胞状态与空间构型来参数化中心位置的细胞状态条件分布,从而实现对微环境异质性与细胞异质性之间概率耦合的定量表征,并在模拟与真实空间转录组数据中展现出优于现有方法的微环境聚类与生物学发现能力。

Kojima, Y., Tanaka, Y., Hirose, H., Chiwaki, F., Nishimura, K., Hayashi, S., Itahashi, K., Ishikawa, M., Shimamura, T., Mano, H.2026-04-24💻 bioinformatics

Genomic dialects: How amino acid properties and the second codon base shape the informational accents of life

该研究提出“基因组方言”框架,通过量化分析 1406 个物种的密码子使用偏好,揭示氨基酸理化性质(特别是 Saier 第二密码子碱基分类)与疏水性等特征显著驱动了物种特异性的“信息口音”形成,表明这种偏好主要受翻译保真度与蛋白质稳定性的双重约束,而非单纯的系统发育关系。

Martinez, O., Ochoa-Alejo, N.2026-04-24💻 bioinformatics

EpiRanha: Hunting for Epitope Similarity with a Structure- and Residue-Aware Graph Neural Network

EpiRanha 是一种结合 ESM-2 序列嵌入与 E(n) 等变图神经网络的框架,通过生成融合序列与空间信息的残级“指纹”及束搜索策略,实现了对构象表位更精准的相似性识别,从而克服了传统方法在评估抗体交叉反应性和脱靶风险时的局限性。

Francissen, T., Babukhian, M., Britze, H., Wilke, Y., Spreafico, R., Demharter, S., Arts, M.2026-04-23💻 bioinformatics