bioinformatics 篇论文

生物信息学宛如一座连接生物学与计算机科学的桥梁，利用强大的算法和数据分析技术，将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察，而是通过代码挖掘基因组的秘密，帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。

作为 Gist.Science 的专属栏目，我们持续追踪来自 bioRxiv 的最新预印本论文，确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理，不仅提供详尽的技术总结，更精心撰写通俗易懂的科普解读，让复杂的生物数据变得清晰易懂。

以下为您呈现该领域最新发表的几项重要研究成果，带您探索生命数字化的最新进展。

该研究提出了一种结合振动光谱与深度学习的快速、无标记方法，仅需微量样品和简单预处理即可高精度地量化 DNA 片段长度分布，为基因组工作流程提供了一种可扩展的替代方案。

本文提出了名为 APEX 的可解释人工智能框架，该框架通过结合进化嵌入与图注意力网络实现跨物种病原体靶点发现，并利用注意力机制指导结构生成模型进行定向分子设计，从而为抗微生物药物研发提供了一条从靶点优先排序到抑制剂生成的端到端解决方案。

本文提出了 scDynOmics，一种受基因调控网络启发并采用 Linformer 注意力机制的预训练 Transformer 模型，它通过单细胞多组学数据学习紧凑的细胞状态嵌入，并利用低秩适应模块实现高效微调，从而在细胞分类、发育轨迹解析及扰动响应预测等任务中达到最先进水平。

本研究结合网络药理学与动物实验，证实了三七（Panax notoginseng）通过多成分、多靶点及多通路（如 NF-κB、MAPK 等）协同调控 TNF-α、IL-6 和 IL-10 等炎症因子，从而优化炎症启动至组织重塑的动态过程，有效促进皮肤伤口愈合。

本文介绍了 SpatialCompassV (SCOMV) 这一计算工具，它通过量化基因和细胞相对于感兴趣区域（如肿瘤）的距离与方向向量，实现了无需先验知识的空间模式无监督分类及空间差异基因识别，从而在乳腺癌和肺癌数据中揭示了新的空间分布特征与恶性状态判别能力。

该研究证明，随着测序准确性的提升，牛津纳米孔（ONT）技术现已能够通过标准去噪算法直接从原始读段生成精确的扩增子序列变异（ASV），从而在无需参考数据库的情况下实现对复杂微生物群落及基因组内变体的可靠分析。

该研究利用 GREIN、STRING 等生物信息学工具分析公共数据，鉴定出创伤后应激障碍、精神分裂症和双相情感障碍共有的关键枢纽基因、转录因子、miRNA 及潜在治疗靶点，揭示了这些精神疾病与自身免疫炎症及感染性疾病之间的分子联系。

该研究通过结合真实数据与模拟实验，系统评估了单细胞 RNA 测序中转座元件位点特异性分析工具的性能，揭示了短读长数据在解析年轻转座元件时的固有局限，并提出了针对旧插入位点、唯一比对策略及亚家族聚合等最佳实践指南。

该研究通过基于代理的模拟表明，加勒比海鹿角珊瑚（*Acropora*）恢复中的杂交虽导致基因渗入的风险较低，但其促进适应性基因交流的能力也极为有限。

本文提出了名为 DeepAllele 的新型深度学习框架，利用具有明确单倍型分型的配对等位基因输入数据，从序列特征中学习预测等位基因间基因调控的细微差异，从而在免疫细胞等模型中更有效地发现功能相关的调控基序并增强基因组因果推断。