bioinformatics 篇论文

生物信息学宛如一座连接生物学与计算机科学的桥梁，利用强大的算法和数据分析技术，将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察，而是通过代码挖掘基因组的秘密，帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。

作为 Gist.Science 的专属栏目，我们持续追踪来自 bioRxiv 的最新预印本论文，确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理，不仅提供详尽的技术总结，更精心撰写通俗易懂的科普解读，让复杂的生物数据变得清晰易懂。

以下为您呈现该领域最新发表的几项重要研究成果，带您探索生命数字化的最新进展。

Leviathan 是一个开源软件包，它通过将无比对分类学方法与 DNA 空间伪比对相结合，绕过计算成本高昂的翻译搜索步骤，从而实现对宏基因组和宏转录组在基因组和泛基因组分辨率下超快速、内存高效且准确的分类学与功能谱分析。

本文提出一个最小化的多尺度计算框架，该框架利用蛋白质动力学和反复破坏机制，系统性地识别并优先选择抗菌靶点以用于合理的多药药理策略，旨在增强治疗效果，同时最小化毒性和突变逃逸。

本文介绍了 gTranslate，这是一种计算高效的机器学习工具，能够在无需预先进行分类学分类的情况下，准确预测原核基因组的翻译表，其准确率超过 99.99%，并能够发现特定细菌谱系中的新型遗传密码变异。

本研究提出了一种计算框架，利用 Evo2 DNA 基础模型，通过量化非编码调控变异对启动子序列的影响，优先筛选结直肠癌中的相关变异，在不依赖监督训练或预定义注释的情况下，成功识别出富集于癌症相关通路和全基因组关联分析位点的高影响候选变异。

SQANTI-browser 是一个新颖的可视化框架，它将 SQANTI3 分类的长读长转录组数据整合到 UCSC 基因组浏览器中，支持交互式过滤、证据引导的注释以及比对伪影的解析，从而在各种数据集中挽救可操作的新型异构体。

CARIBOU 是一个多智能体人工智能框架，专为在机构高性能计算环境中实现自主、迭代且可重复的生物信息学分析而设计，它利用研究人员可编辑的蓝图和持久可执行状态，以克服在处理大规模单细胞和空间组学数据集时静态代码生成的局限性。

VaxjoOnto 是一个新颖的框架，它利用疫苗本体驱动的异构知识图谱和图神经网络，有效优先筛选针对已知和新发疾病的佐剂，通过将研究重点从抗原发现转向佐剂选择，从而解决疫苗开发中的关键瓶颈。

本文引入了SBB（信号、边界和基线）框架以严格评估虚拟细胞扰动模型，揭示复杂的深度学习方法往往无法在实质上超越简单的线性基线，并强调了需要标准化指标来区分真实的生物信号与统计假象。

本研究建立了一个最佳实践框架，用于构建同时多组学加权基因共表达网络，以分析啮齿动物模型中的甲状腺毒性与恢复过程，结果表明，将未缩放的组学层进行串联可在保留生物结构的同时，通过互补的模块保留分析和差异连接分析揭示广泛的分子破坏及部分恢复。

GAE-Δ框架利用图自编码器对跨多组学数据的表型特异性基因网络重连进行建模，相较于现有的线性分解和基于网络的方法，实现了更优的临床结果预测并识别出具有生物学意义的癌症驱动因子。