bioinformatics 篇论文

生物信息学宛如一座连接生物学与计算机科学的桥梁，利用强大的算法和数据分析技术，将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察，而是通过代码挖掘基因组的秘密，帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。

作为 Gist.Science 的专属栏目，我们持续追踪来自 bioRxiv 的最新预印本论文，确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理，不仅提供详尽的技术总结，更精心撰写通俗易懂的科普解读，让复杂的生物数据变得清晰易懂。

以下为您呈现该领域最新发表的几项重要研究成果，带您探索生命数字化的最新进展。

本文提出了名为"10-minimizers"的新型最小化子类，证明了其在非渐近区间内具有比随机最小化子更低的期望密度，并进一步设计了兼具常数空间、低密度和快速 k-mer 键检索特性的"spacers"方案，从而在性能上超越了现有的常数空间最小化子方法。

本文提出了名为 scTimeBench 的模块化基准平台，通过评估九种主流方法在预测准确性、嵌入一致性和谱系保真度等关键任务上的表现，揭示了现有单细胞时间序列分析方法在保持生物信号和谱系重建方面的不足，并发布了相应的开源 Python 工具包以推动该领域的标准化评估。

MosaicTR 是一种利用长读长测序数据量化串联重复序列体细胞不稳定性的工具，它克服了短读长测序的读长和 PCR 滑动限制，通过 motif 单元加权指标有效降低测序噪声，并支持在不同组织或时间点间检测特异性不稳定性变化。

该论文提出了一种名为 MutationNetwork 的图框架，通过整合长程染色质相互作用与局部基因组重叠来构建突变中心网络，从而有效区分驱动突变与乘客突变，并在乳腺癌亚型分类及非编码驱动突变优先排序中展现出显著性能。

本文介绍了 VICAST 这一集成工具包，它通过结合半自动化基因组注释与人工审查、针对低频变异优化的检测流程以及多路径注释方案，有效解决了病毒传代研究中现有工具在功能注释准确性和低频变异分析方面的局限，并已在多种病毒数据集及 Chikungunya 病毒新注释中验证了其高效性与实用性。

本文提出了一种名为 SLAB 的高效扫描线算法，用于在 PBWT 框架下识别单倍型块核心（即多个单倍型块重叠的基因组片段），并通过 UK Biobank 数据分析展示了其在揭示选择信号及补充传统 IBD 分析方法方面的生物学价值。

OmicClaw 是一个基于统一 OmicVerse 生态系统和 J.A.R.V.I.S. 运行时的可执行自然语言框架，它通过将用户请求转化为可追溯的工作流，解决了多组学分析中工具碎片化和可重复性不足的问题，并显著提升了复杂任务的分析性能与交互体验。

该研究构建了一个整合表型扩散、资源竞争及生命史权衡的表型结构偏微分方程模型，揭示了肿瘤增殖异质性的生态进化动态，并阐明不同靶向治疗方案如何通过重塑适应度景观导致肿瘤进化轨迹的分化，从而为设计能预测和对抗适应性耐药的治疗策略提供了理论框架。

本文介绍了 3D-Manhattan，这是一款基于 WebGL 的交互式浏览器工具，它通过将多个全基因组关联分析（GWAS）结果整合到统一的三维坐标系中，克服了传统二维曼哈顿图在比较不同时间点、性状或实验条件下遗传信号时的局限性，从而有效促进了稳定及动态遗传关联的探索性分析。

本研究提出了一种整合人工智能、量子化学与结构生物信息学的综合框架，通过从头设计并计算验证新型小分子"Solres"，使其能够靶向结合青枯菌等植物病原菌的关键毒力蛋白，从而为应对抗生素耐药性威胁下的作物病害防治提供了具有潜力的先导化合物及计算策略。