Benchmarking long-read simulators against Oxford Nanopore whole-genome sequencing data
本研究将六种 Oxford Nanopore 读长模拟工具与 R10.4.1 数据进行基准测试,发现尽管 PBSIM3 在复现整体读长层面特性方面表现优异,但没有任何工具能完全捕捉真实数据的复杂错误谱,这表明最佳选择取决于特定应用中是读长层面的真实性还是特定错误结构更为关键。
756 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本研究将六种 Oxford Nanopore 读长模拟工具与 R10.4.1 数据进行基准测试,发现尽管 PBSIM3 在复现整体读长层面特性方面表现优异,但没有任何工具能完全捕捉真实数据的复杂错误谱,这表明最佳选择取决于特定应用中是读长层面的真实性还是特定错误结构更为关键。
本文提出并验证了一种简单、快速且可自适应的基于聚类的(CBED)事件检测算法,该算法在生物纳米孔数据的效率和降噪方面优于现有方案,同时强调了自适应基线校正对固态纳米孔数据的必要性。
本研究介绍了 TmProt 1.0,这是一个经过微调的 ESM-2 嵌入模型,其在跨异构生物物理数据集识别热稳定蛋白方面优于现有的最先进预测器,从而解决了蛋白质熔解温度预测中跨域泛化的关键挑战。
本文介绍了一种基于扩散的生成模型,该模型具备保持稀疏性的机制,能够在人类微生物组数据上实现参数级稀疏性保持并具有竞争力的生态距离指标,代表了首个在保持此类稀疏保真度的同时于标准生态基准上仍具竞争力的深度学习方法。
本文介绍了 conMItion,这是一个 R 语言软件包,它利用条件互信息在多组学关联分析中稳健地校正肿瘤纯度、突变负荷等混杂因素,从而提高识别癌症相关基因和细胞相互作用的准确性。
本文介绍了 DipGenie,这是一种可扩展工具,它利用具有生物学依据的重组预算,在泛基因组图上联合优化基因分型和单倍型定相,与现有的基于图的方法相比,实现了显著更低的切换错误率和更高的结构变异 F1 分数。
WSInsight 是一个开放、云原生的平台,能够从多样化的存储源实现可扩展的、可被代理调用的全切片 H&E 图像的单细胞表型分析,为转化肿瘤微环境研究提供经过验证且符合标准的输出结果。
LIVIA 是一款免费且基于浏览器的工具,它通过交互式 3D 查看器以及适用于 ChimeraX 和 PyMOL 的可导出脚本,在本地计算局部置信度指标、识别界面残基,并在多个平台上可视化预测的蛋白质 - 蛋白质相互作用。
本研究开发了一种机器学习框架,用于在 SomaScan 与 Olink 平台之间填补跨平台蛋白质组学数据,从而解决持续存在的不可重复性问题、实现平台独有信号的恢复,并建立蛋白质保真度指数以提升流行病学生物标志物发现的可靠性。
本研究利用跨数据集整合转录组分析,鉴定出帕金森病中与氧化应激和炎症相关的枢纽基因,并揭示了特定生物活性食品化合物如何通过营养基因组学干预调节这些基因网络。