A Robust and Integrated Framework for Cross-platform Adaptation of Epigenetic Clocks in Cell-free DNA Sequencing
该研究通过系统基准测试确立了关键参数与迁移学习策略,构建了一个稳健的集成框架,成功解决了基于阵列的表观遗传时钟在跨平台应用于高通量测序无细胞 DNA 数据时的兼容性问题。
1243 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
该研究通过系统基准测试确立了关键参数与迁移学习策略,构建了一个稳健的集成框架,成功解决了基于阵列的表观遗传时钟在跨平台应用于高通量测序无细胞 DNA 数据时的兼容性问题。
该研究通过区分“耐受性”与“隐蔽性”自身抗原,揭示了抗原加工重编程导致原本未被呈递的自身蛋白暴露,从而成为驱动器官特异性自身免疫疾病的一种独立于传统免疫耐受失效的致病机制。
该研究提出了一种仅基于基因型数据的新型计算框架,通过利用跨染色体定相推导出的单倍型共享特征并结合高斯混合模型,在无需谱系信息或已知亲属的情况下,实现了对半同胞与叔侄/舅甥关系的高精度(>98%)区分,并进一步利用这些高置信度标签优化了长距离定相的准确性。
该论文首次建立了系统发育压缩的数学框架,证明了在无限位点模型下,通过邻接法(NJ)求解基因组排序可在多项式时间内获得最优压缩,从而从理论上解释了基于系统发育的压缩与索引启发式方法在细菌基因组学中的高效性。
本文介绍了 GYDE,这是一个开源的 Web 协作平台,旨在通过集成可视化界面和先进的人工智能模型,帮助实验科学家轻松进行蛋白质与抗体的结构预测、设计及功能分析,从而加速药物发现进程。
本文介绍了首个生物信息学工具"TattleTail",它通过利用保守的绿脓杆菌素基因簇标记并排除噬菌体特有基因(如衣壳和整合酶),成功区分了绿脓杆菌中的噬菌体尾状细菌素(pyocins)与溶原性噬菌体,从而解决了现有工具易将前者误判为后者的问题,并通过实验验证了其在临床菌株中预测的准确性。
本文介绍了 KyDab(Kymouse 抗体数据库),这是一个基于标准化 Kymouse 人源化小鼠平台构建的综合数据库,收录了涵盖 51 种免疫原的 11 项研究、超过 12 万条配对轻重链序列及结合数据,旨在为抗体发现的人工智能模型开发与评估提供包含完整筛选漏斗和一致元数据的关键资源。
本文介绍了 MEIsensor,这是一种基于深度学习的框架,能够直接从长读长测序数据中高效、准确地检测并分类 Alu、LINE1 和 SVA 等转座子插入,尤其在复杂结构变异和高度重复区域的表现上显著优于现有工具。
该论文提出了一种基于强化学习的框架,用于微调扩散模型(DiffDock-Pocket),使其在无需增加推理计算成本的情况下,能够生成更多符合物理约束、保留关键相互作用且结构更准确的分子对接构象,特别是在处理与训练数据差异较大的蛋白靶点时表现优于传统及现有机器学习方法。
SAPTICoN 是一款基于 Seurat 框架和 Snakemake 工作流的稳健无代码单细胞转录组分析管线,旨在通过自动生成注释包和标准化流程,使缺乏生物信息学背景的研究人员能够轻松对非模式生物及注释匮乏的组织进行可重复的高质量分析。