Accounting for Defective Viral Genomes in viral consensus genome reconstruction, application to influenza virus
本文介绍了 DIPScan 这一新方法,它能够准确检测流感病毒测序数据中的缺失型病毒基因组(DelVGs),并校正由此产生的共识序列错误,从而提升病毒基因组重建的准确性。
1245 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文介绍了 DIPScan 这一新方法,它能够准确检测流感病毒测序数据中的缺失型病毒基因组(DelVGs),并校正由此产生的共识序列错误,从而提升病毒基因组重建的准确性。
本文提出了一种名为 MultiPopPred 的新型跨种族多基因风险评分估计方法,该方法利用 Nesterov 平滑惩罚收缩模型整合多个辅助人群数据,显著提升了南亚人群等低资源群体的疾病风险预测精度。
该研究提出了一种结合短读长全转录组扩增与长读长靶向测序的混合策略及配套流程,旨在通过平衡广覆盖与深测序优势,突破单细胞分辨率下基因型 - 表型关联分析的覆盖度瓶颈。
该论文介绍了一种名为 resolveS 的快速轻量级工具,它通过比对通用 rRNA 数据库来推断 RNA-seq 文库的链特异性,从而无需依赖特定物种的参考基因组即可高效解决公共数据中元数据缺失的问题。
该研究通过将小分子结合蛋白设计构建为序列到序列的翻译任务,利用大规模配体 - 蛋白数据集训练了纯序列条件的蛋白质语言模型,揭示了监督模糊性导致的“泛化与记忆”权衡现象,并指出数据冗余与不完整是序列级结合蛋白设计的主要瓶颈。
本文提出了一种基于多智能体大语言模型的系统,通过自动化文献检索、协议提取与对比分析,显著优化了重组蛋白纯化流程并提升了实验成功率,同时也指出了当前科学文献缺乏程序化开放访问这一关键限制。
该研究通过整合多组学数据,揭示了染色体 8q24.3 区域编码的 microRNAs 在卵巢癌中的表达异质性与调控复杂性,并发现 miR-937、miR-4664 和 miR-6849 的高表达与高级别浆液性卵巢癌患者的总生存期改善相关,提示其作为潜在预后标志物的价值。
该研究提出了一种基于动物学框架的 ribozyme 进化新理论,通过将七类小自切割核酶映射为原始海洋动物身体构型并构建生态互作网络,揭示了核酶在 RNA 世界中的捕食者 - 猎物关系、模块化演化机制及古代生态位,从而为不依赖序列假设推断早期 RNA 形式提供了新途径。
本文介绍了名为 Owl 的长读长测序分析工具,它利用包含超过 14 万个微卫星标记的全基因组策略和变异系数算法,成功实现了对肿瘤样本中微卫星不稳定性(MSI)的精准量化与基序特异性模式解析,并验证了其在癌症基因组学中的应用价值。
该研究通过分析 1,194 个计算结合体,推翻了“静态结合亲和力是尼帕病毒中和关键”的假设,提出了强调结构灵活性和末端序列模体等特征的“动力学兼容性假说”,并构建了结合经验数据与机器学习预测的 10 点筛选框架以指导 15 kDa 迷你蛋白支架的候选药物开发。