bioinformatics 篇论文 | Gist.Science

生物信息学宛如一座连接生物学与计算机科学的桥梁，利用强大的算法和数据分析技术，将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察，而是通过代码挖掘基因组的秘密，帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。

作为 Gist.Science 的专属栏目，我们持续追踪来自 bioRxiv 的最新预印本论文，确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理，不仅提供详尽的技术总结，更精心撰写通俗易懂的科普解读，让复杂的生物数据变得清晰易懂。

以下为您呈现该领域最新发表的几项重要研究成果，带您探索生命数字化的最新进展。

Benchmarking circRNA Detection Tools from Long-Read Sequencing Using Data-Driven and Flexible Simulation Framework

本研究开发了一个数据驱动的灵活模拟框架，首次系统评估了 CIRI-long、IsoCIRC 和 circNICK-Irs 三种工具在牛津纳米孔长读长测序数据中检测 circRNA 的性能，揭示了各工具在灵敏度、精度及重叠度上的显著差异，并为该领域的工具选择与算法优化提供了重要参考。

Rusakovich, A., CORRE, S., Cadieu, E., Fraboulet, R.-M., Le Bars, V., Galibert, M.-D., Derrien, T., Blum, Y.2026-03-06💻 bioinformatics

Joint Learning of Drug-Drug Combination and Drug-DrugInteraction via Coupled Tensor-Tensor Factorization with SideInformation

本文提出了一种基于耦合张量分解与多视图辅助信息（如化学结构、副作用等）的联合学习框架（SI-ADMM），通过改进的 ADMM 算法在解决数据稀疏问题的同时，实现了对药物组合疗效与药物相互作用（包括新药场景）的同步预测，并在多源数据集上验证了其优越性。

Zhang, X., Fang, Z., Tang, K., Chen, H., Li, J.2026-03-06💻 bioinformatics

t2pmhc: A Structure-Informed Graph Neural Network to predict TCR-pMHC Binding

本文提出了 t2pmhc，这是一种利用 TCR-pMHC 复合物预测结构构建的图神经网络框架，通过捕捉三维结构相互作用显著提升了模型对未见肽段的泛化能力，并揭示了与生物学机制一致的注意力分配模式。

Polster, M., Stadelmaier, J., Ball, E., Scheid, J., Bauer, J., Nelde, A., Claassen, M., Dubbelaar, M. L., Walz, J. S., Nahnsen, S.2026-03-06💻 bioinformatics

Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles

本文提出了 RigidSSL，一种通过结合大规模结构扰动与分子动力学轨迹、利用双向刚性感知流匹配目标来学习几何先验的自监督预训练框架，显著提升了蛋白质设计的可设计性、新颖性及构象集合的物理真实性。

Ni, Z., Li, Y., Qiu, Z., Schölkopf, B., Guo, H., Liu, W., Liu, S.2026-03-06💻 bioinformatics

ProtNHF: Neural Hamiltonian Flows for Controllable Protein Sequence Generation

本文提出了 ProtNHF，一种基于神经哈密顿流的生成模型，它通过在推理阶段引入解析偏置函数而非重新训练，实现了对蛋白质序列氨基酸组成和净电荷等属性的连续、可解释且可预测的定量控制。

Raghavan, B., Rogers, D. M.2026-03-06💻 bioinformatics

Single-Cell Genomics Decontamination with CellSweep

本文介绍了一种名为 CellSweep 的高效工具，旨在从单细胞基因组数据中去除由裂解细胞释放的游离环境分子及文库制备引入的全局污染，从而提升下游分析的准确性，且其性能在多项基准测试中优于现有方法。

Caskey, M., Rich, J., Weber, R., Mortazavi, A., Pachter, L., Hallgrimsdottir, I. B.2026-03-06💻 bioinformatics

Using Variable Window Sizes for Phylogenomic Analyses of Whole Genome Alignments

本研究提出了一种基于分裂与合并策略的变长窗口方法，以克服固定窗口大小在重组率变化染色体上的局限性，并通过模拟和真实数据（凤蝶和类人猿）验证了该方法在恢复基因树拓扑结构方面的优越性。

Ivan, J., Lanfear, R.2026-03-06💻 bioinformatics

Reliable prediction of short linear motifs in the human proteome

本文介绍了 SLiMMine，这是一种基于深度学习的方法，通过利用蛋白质嵌入和神经网络，能够从高误报率的模式匹配结果中可靠地预测人类蛋白质组中的短线性基序（SLiMs），并作为发现工具识别未表征的基序及精确预测蛋白质相互作用。

Pancsa, R., Ficho, E., Kalman, Z. E., Gerdan, C., Remenyi, I., Zeke, A., Tusnady, G. E., Dobson, L.2026-03-06💻 bioinformatics

A latent space thermodynamic model of cell differentiation

本文提出了名为“潜在空间动力学（LSD）”的热力学启发式框架，该框架通过在潜在空间中构建可微势函数和局部熵项，利用神经常微分方程从单细胞时序数据中重建连续的细胞分化轨迹，从而在准确推断谱系层级、预测细胞命运及量化发育与癌症中的细胞可塑性方面优于现有方法。

Poursina, A., Hajhashemi, S., Mikaeili Namini, A., Saberi, A., Emad, A., Najafabadi, H. S.2026-03-06💻 bioinformatics

RNA-seq analysis in seconds using GPUs

该研究通过针对 GPU 大规模并行特性重新设计伪比对、等价类交集和 EM 算法等核心模块，实现了 kallisto RNA-seq 转录本定量工具的 GPU 版本，使其在基准测试中比多线程 CPU 版本快 30 至 50 倍，将典型样本的处理时间从数分钟缩短至数秒。

Melsted, P., Guthnyjarson, E. M., Nordal, J.2026-03-06💻 bioinformatics

← 上一页下一页 →