bioinformatics 篇论文

生物信息学宛如一座连接生物学与计算机科学的桥梁，利用强大的算法和数据分析技术，将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察，而是通过代码挖掘基因组的秘密，帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。

作为 Gist.Science 的专属栏目，我们持续追踪来自 bioRxiv 的最新预印本论文，确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理，不仅提供详尽的技术总结，更精心撰写通俗易懂的科普解读，让复杂的生物数据变得清晰易懂。

以下为您呈现该领域最新发表的几项重要研究成果，带您探索生命数字化的最新进展。

Non-consensus flanking sequence of hundreds of base pairs around in vivo binding sites: statistical beacons for transcription factor scanning

该研究通过分析体内结合位点周围长达数千碱基对的序列，发现转录因子结合位点两侧存在显著的 GC 含量升高及特定的序列特征，并提出这些非共识的“统计信标”通过改变 DNA 形状或辅助其他转录因子结合，构成了帮助转录因子进行粗扫描并定位靶标位点的机制。

Faltejskova, K., Sulc, J., Vondrasek, J.2026-03-10💻 bioinformatics

Generating Hybrid Proteins with the MSA-Transformer

该论文提出了一种利用 MSA-Transformer 的随机迭代框架，通过结合掩码策略、束搜索及稀疏自编码器分析，在序列空间中生成融合源蛋白与目标蛋白特性的功能增强型杂合蛋白，并验证了其在保留核心折叠与催化特征方面的有效性。

Tule, S., Davis, S., Koludarov, I., Mora, A., Boden, M.2026-03-10💻 bioinformatics

Bridging the gap between genome-wide association studies and network medicine with GNExT

本文介绍了 GNExT（GWAS 网络探索工具），这是一个集成了 MAGMA 和 Drugst.One 等系统的网络医学方法的 Web 平台，旨在通过将全基因组关联研究（GWAS）结果转化为可解释的分子网络模块来揭示疾病机制并发现药物重定位候选者，同时提供标准化的 Nextflow 流程以支持大规模数据的部署与应用。

Arend, L., Woller, F., Rehor, B., Emmert, D., Frasnelli, J., Fuchsberger, C., Blumenthal, D. B., List, M.2026-03-10💻 bioinformatics

scProfiterole: Clustering of Single-Cell Proteomic DataUsing Graph Contrastive Learning via Spectral Filters

本文提出了名为 scProfiterole 的计算框架，通过利用 Arnoldi 正交化实现谱图滤波器的多项式插值，并结合图对比学习，有效解决了单细胞蛋白质组数据中缺失值和噪声问题，从而显著提升了细胞类型聚类的准确性与鲁棒性。

Coskun, M., Lopes, F. B., Kubilay Tolunay, P., Chance, M. R., Koyuturk, M.2026-03-10💻 bioinformatics

AQuA2-Cloud: a web platform for fluorescence bioimaging activity analysis

本文介绍了 AQuA2-Cloud，这是一个基于云的 Web 平台，旨在通过消除 MATLAB 许可依赖并支持多用户协作，使研究人员能够便捷地利用标准浏览器对荧光生物成像数据进行高精度的时空活动分析。

Bright, M., Mi, X., Duarte, D., Carey, E., Lyu, B., Wang, Y., Nimmerjahn, A., Yu, G.2026-03-10💻 bioinformatics

Measuring Amorphous Motion: Application of Optical Flow to Three-Dimensional Fluorescence Microscopy Images

本文介绍了一种名为 OpticalFlow3D 的易用光学流工具，旨在克服生物成像中非刚性结构运动分析的难点，通过直接处理三维荧光显微镜图像像素级运动数据，为从蛋白质到生物体尺度的定量生物学研究提供新见解。

Lee, R. M., Eisenman, L. R., Hobson, C., Aaron, J. S., Chew, T.-L.2026-03-10💻 bioinformatics

Automatic Generation of Model Sequences for Complex Regions in Assembly Graphs

本文提出了名为“简单缠结遍历器（TTT）”的算法，利用深度覆盖和读段比对信息，通过混合整数线性规划与欧拉路径优化自动解决基因组组装图中因长重复序列导致的复杂缠结问题，从而消除人工干预需求并填补组装缺口。

Antipov, D., Chen, Y., Sollitto, M., Phillippy, A. M., Formenti, G., Koren, S.2026-03-10💻 bioinformatics

In silico analysis of the human titin protein (Immunoglobulin-like, fibronectin type III, and Protein kinase domains) as a potential forensic marker for postmortem interval (PMI) estimation

本研究通过计算机模拟分析，首次揭示了人类肌联蛋白（Titin）中免疫球蛋白样、纤连蛋白 III 型和蛋白激酶结构域具有不同的降解稳定性，从而为将其作为推断死后间隔时间（PMI）的多结构域生物标志物奠定了理论基础。

Gill, M. U., Akhtar, M.2026-03-10💻 bioinformatics

DIA-NN EasyFilter workflow for the fast and user-friendly critical assessment and visualization of DIA-NN proteomics analysis outcome

本文介绍了一种基于 KNIME 的 DIA-NN EasyFilter 工作流，旨在通过提供无需编程技能即可执行的快速、用户友好的蛋白质过滤与可视化功能，解决 DIA-NN 原始输出文件难以直接分析的问题，从而提升大规模蛋白质组学数据的评估准确性与可解释性。

Moagi, M. G., Thatiana, F. F., Kristof, E. K., Arda, A. G., Arianti, R., Horvatovich, P., Csosz, E.2026-03-10💻 bioinformatics

NanoVI: a Bayesian variational inference Nextflow pipelinefor species-level taxonomic classification from full-length16S rRNA Nanopore reads

NanoVI 是一款基于 Nextflow 的开源流程，它利用贝叶斯变分推断和 GTDB 数据库，能够比现有工具更快速、准确地对全长 16S rRNA Nanopore 读段进行物种级分类，并提供包含不确定性量化的丰度估计。

Curiqueo, C., Fuentes-Santander, F., Ugalde, J. A.2026-03-10💻 bioinformatics