Interpretable Antibody-Antigen Structural Interface Prediction via Adaptive Graph Learning and Cyclic Transfer
本文提出了名为 VASCIF 的可解释性框架,该框架基于掩蔽图注意力机制,通过自适应图学习和循环迁移策略,在克服数据稀缺与类别不平衡挑战的同时,实现了高效且准确的抗体 - 抗原结构界面预测,并揭示了符合生物物理原理的相互作用模式。
1235 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文提出了名为 VASCIF 的可解释性框架,该框架基于掩蔽图注意力机制,通过自适应图学习和循环迁移策略,在克服数据稀缺与类别不平衡挑战的同时,实现了高效且准确的抗体 - 抗原结构界面预测,并揭示了符合生物物理原理的相互作用模式。
本文提出了 HiReS 这一开源工作流,通过分块处理、YOLO 实例分割及后处理重建等步骤,实现了从高分辨率浮游生物图像中自动化提取形态特征,并验证了其在保持样本分布结构及低采样深度下优于人工估计的准确性。
本文介绍了 scLongTree,这是一款能够基于纵向单细胞 DNA 测序数据准确推断肿瘤亚克隆进化树、在准确性和可扩展性上优于现有工具(如 LACE、SCITE 和 SiCloneFit)且适用于大规模数据集的新型计算工具。
本文介绍了专为分析 RNA 末端测序数据而开发的 R 包 rnaends,该工具能够处理从原始数据预处理、末端定位定量到下游分析(如转录起始位点鉴定、共翻译降解动力学及转录后修饰研究)的全流程,填补了该领域缺乏通用分析包的空白。
该研究提出了一种名为“相干去噪”的生成式扩散框架,能够从任意子集的多模态数据中合成缺失模态,在包含万余例样本的癌症多组学数据集上验证了其生成高保真数据的能力,有效解决了数据稀疏问题并提升了精准肿瘤学中的预测性能与诊断测试优先级规划。
本文介绍了 COMPASS,一种基于确定性逻辑和阈值机制的无本体 Web 系统,它无需排列检验或参考队列即可将基因表达转化为可解释的通路活性评分,从而生成稳定且可转移的数字生物标志物,在性能稳健性和双向基因程序整合方面优于 GSVA 和 ssGSEA 等现有方法。
本文介绍了 AEGIS,这是一个开源的命令行工具包,旨在通过标准化基因组注释文件、提供灵活的特征提取功能以及整合多证据比较基因组学工作流,来解决 GTF/GFF3 格式不一致的问题并提升生物信息学分析的可靠性。
该研究通过比较基因组学分析,鉴定了根结线虫属中大量具有独特分子特征的孤儿基因,并揭示了其部分源于基因高度分歧、部分源于从头起源的演化历史,暗示这些基因在根结线虫全球寄生适应性中发挥重要作用。
该论文提出了名为 DyGraphTrans 的动态图表示学习框架,通过将电子健康记录建模为时序图并利用滑动窗口机制,在降低内存消耗的同时实现了对疾病进展的高效预测与可解释性分析。
本文提出了 PRIZM 工作流,通过利用极少量(约 20 个)标记数据筛选出最适合特定蛋白质性质的预训练零样本模型,进而高效指导蛋白质变体的设计与优化,在无需大量数据和深厚计算背景的情况下成功提升了酶的热稳定性和活性。