bioinformatics 篇论文

生物信息学宛如一座连接生物学与计算机科学的桥梁，利用强大的算法和数据分析技术，将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察，而是通过代码挖掘基因组的秘密，帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。

作为 Gist.Science 的专属栏目，我们持续追踪来自 bioRxiv 的最新预印本论文，确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理，不仅提供详尽的技术总结，更精心撰写通俗易懂的科普解读，让复杂的生物数据变得清晰易懂。

以下为您呈现该领域最新发表的几项重要研究成果，带您探索生命数字化的最新进展。

💻 bioinformatics

TDP-43 regulates chromatin looping and gene transcription through binding and stabilizing DNA G-quadruplex structures

本研究揭示，TDP-43 通过结合并稳定染色质环锚点处的 DNA G-四链体结构来调控基因转录并促进长程染色质环的形成，从而为 TDP-43 功能障碍相关疾病中的基因失调提供了机制性解释。

Yang, F., Zhang, S., Guo, X., Qiao, Y., Zhang, Y., Sun, H., Chen, X., Wang, H.2026-05-15

💻 bioinformatics

Deep Learning for Cross-Domain Spatial Transcriptomic Modeling of Tissue Repair

本研究提出了一种跨域深度学习框架，该框架利用基于复现的潜在分析方法和病理碎片化指标，以表征和比较异质性人类数据集中组织修复与肿瘤微环境的空间组织及重塑动态。

Pham, T. D.2026-05-15

💻 bioinformatics

A modular Bayesian framework for inferring transmission networks from polyclonal infections, with application to Plasmodium falciparum

本文介绍了一种模块化贝叶斯框架，以针对恶性疟原虫的 Plasmotrack 软件为例，该框架通过容纳多个遗传来源和未观测到的亲本，从多克隆感染中重建定向传播网络，从而估算关键的公共卫生指标。

Murphy, M. R., Nielsen, R., Perkins, A., Greenhouse, B.2026-05-15

💻 bioinformatics

Viral non-coding RNA structure annotation and API-based data retrieval with Rfam and R2DT

本文提出了计算协议和实用示例，用于自动化病毒非编码RNA注释并通过其RESTful API编程检索Rfam数据，同时利用R2DT生成全面的二维结构可视化，以便整合到生物信息学和机器学习工作流中。

Muston, P., Triebel, S., Nawrocki, E., Ontiveros-Palacios, N., Jandalala, I., Sweeney, B., Bateman, A., Marz, M., Petrov (…)2026-05-14

💻 bioinformatics

PXN Unlocks the Power of Public Gene Expression Data Through Cross-Technology Integration

本文介绍了 PXN，这是一种概率机器学习框架，它通过将多样化的数据集（包括衔接微阵列和 RNA-seq 技术）无缝转换为统一表示，克服了公共基因表达数据中的跨平台不兼容性，从而显著提升了大规模整合生物学分析的准确性和统计效力。

Sui, Z., Yu, D., Erdengasileng, A., Zhang, J., Qiu, X.2026-05-14

💻 bioinformatics

Cataloging cysteines in ECOD domains using a protein language model

作者开发了 TriCyP，这是一种基于蛋白质语言模型的工具，能够从预测结构中准确预测半胱氨酸的功能状态（二硫键结合、金属配位和游离巯基），从而构建了涵盖 ECOD 结构域的 270 万个半胱氨酸的蛋白质组级目录，该目录揭示了独特的生物学模式，并鉴定出新型金属结合家族及潜在的蛋白质 - 蛋白质相互作用。

Yuan, R. D., Durham, J., Cong, Q., Schaeffer, R. D. D.2026-05-14

💻 bioinformatics

Protein solubility depends on centrifugation: Aiki-Sol, a per-regime predictor for E. coli

本文介绍了 Aiki-Sol，一种蛋白质溶解度预测模型，它通过将离心条件明确视为关键特征而非噪声，克服了现有模型的性能瓶颈，并在一个新发布的、标注了严格度条件的大肠杆菌数据集上实现了显著的精度提升。

Rajagopalan, R., Meda, R. S., Shastry, S., Mysore, V.2026-05-14

💻 bioinformatics

A Context-Specific, Literature-Supported Framework for Validating Stress Response Differentially Expressed Gene Sets

本文提出了一种特定于情境的框架，该框架通过利用局限于差异表达基因中的蛋白质相互作用网络来验证应激反应基因集，证明了具有生物学依据的“主要响应”基因在不同温度条件下形成了显著互联的亚网络。

Frishman, B. A., Gonzalez, J. L., Forbes, V. E.2026-05-13

💻 bioinformatics

De novo protein discovery in non-model organisms

作者开发了一种名为"plant"的从头计算方法，该方法类似于色谱法，能够在无需参考基因组的情况下对非模式生物转录组中的蛋白质结构域进行比较、注释和定量，这一能力已通过利用 1KP RNA-seq 数据对卷柏属物种的分析得到证实。

Ali, A.2026-05-13

💻 bioinformatics

An improved generic schema for high fidelity data linkage and sample tracing across complex multi-assay medical entomology studies

本文证明，改进的通用数据模式成功确保了坦桑尼亚复杂、多团队、多阶段的疟疾媒介研究中高保真度的数据链接和稳健的样本可追溯性，实现了从野外采集到昆虫室饲养及实验室分析的近完美数据整合。

Kavishe, D. R., Msoffe, R. V., Mmbaga, S., Tarimo, L. J., Butler, F., Kaindoa, E. W., Govella, N. J., Kiware, S. S., Kil (…)2026-05-13