生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。

作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。

以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。

Evidence of off-target probe binding affecting 10x Genomics Xenium gene panels compromise accuracy of spatial transcriptomic profiling

该研究开发了 Off-target Probe Tracker (OPT) 工具,揭示了 10x Genomics Xenium 技术中探针脱靶结合会扭曲空间转录组数据的准确性,并通过多组学验证证实了部分基因的表达信号实为靶基因与脱靶基因信号的混合,从而提升了空间转录组数据的生物学可解释性与可重复性。

Hallinan, C., Ji, H. J., Tsou, E., Salzberg, S. L., Fan, J.2026-03-13💻 bioinformatics

Per-residue optimisation of protein structures: Rapid alternative to optimisation with constrained alpha carbons

本文提出了一种名为 PROPTIMUS RAPHAN 的蛋白质结构逐残基优化方法,通过将结构划分为重叠子结构进行独立优化,实现了计算时间随结构规模线性增长,并验证了结合 GFN-FF 力场的实现方案在显著缩短耗时的同时,能达到与约束α碳优化相当的结构质量。

Schindler, O., Bucekova, G., Svoboda, T., Svobodova, R.2026-03-13💻 bioinformatics

scprocess: a pipeline for processing, integrating and visualising atlas-scale single cell data

本文介绍了 scprocess,这是一个专为 10x Genomics 技术生成的百万级单细胞数据而设计的 Snakemake 自动化流程,旨在通过统一的命令行接口解决大规模数据集在管理、效率及可重复性方面的挑战,实现从原始测序文件到标准化分析结果的端到端处理。

Koderman, M., Pilarski, J., Bianco, E., Gonzalez, D., Robinson, M. D., Macnair, W.2026-03-13💻 bioinformatics

Descriptron-GBIF Annotator: A browser-based platform for crowdsourced morphological annotation of biodiversity images to help accelerate morphology based biodiversity data

本文介绍了"Descriptron-GBIF Annotator",这是一款基于浏览器的零安装众包工具,利用 AI 辅助和受控词汇表对来自 GBIF 的生物多样性图像进行形态学标注,旨在通过公民科学模式加速结构化形态数据的生成,并与专业工作平台形成互补反馈循环以应对生物多样性危机。

Van Dam, A. R., Hita Garcia, F.2026-03-13💻 bioinformatics

Fast and accurate resolution of ecDNA sequence using Cycle-Extractor

本文介绍了 Cycle-Extractor(CE),这是一种利用混合整数线性规划从短读长或长读长测序数据中快速、准确地重构 ecDNA 环状结构的新工具,其速度比现有工具 CoRAL 快 40 倍,且在模拟数据和真实癌细胞系(如 PC3 细胞)中展现出更高的重构精度与完整性。

Faizrahnemoon, M., Luebeck, J., Hung, K. L., Rao, S., Prasad, G., Tsz-Lo Wong, I., G. Jones, M., S. Mischel, P., Y. Chang, H., Zhu, K., Bafna, V.2026-03-13💻 bioinformatics

DNA-MGC+: A versatile codec for reliable and resource-efficient data storage on synthetic DNA

本文介绍了 DNA-MGC+,这是一种专为合成 DNA 数据存储设计的通用编解码器,它通过在不同测序平台(Illumina 和 Nanopore)及严苛错误条件下(如高达 24% 的 IDS 错误率)展现出优于现有方案的可靠性、资源效率及纠错能力,实现了更低的测序深度需求和读取成本。

Khabbaz, R., Mateos, J., Antonini, M., Kas Hanna, S.2026-03-13💻 bioinformatics