FlyPredictome: A structural atlas of predicted protein-protein interactions in Drosophila
该研究构建了名为 FlyPredictome 的果蝇结构互作组数据库,通过 150 万个 AlphaFold-Multimer 预测系统解析了果蝇蛋白相互作用的结构特征与功能界面,并揭示了其模块化组织规律。
756 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
该研究构建了名为 FlyPredictome 的果蝇结构互作组数据库,通过 150 万个 AlphaFold-Multimer 预测系统解析了果蝇蛋白相互作用的结构特征与功能界面,并揭示了其模块化组织规律。
本文介绍了 trackDJ,这是一个旨在通过提供高默认值的绘图函数和统一框架,让用户无需深入编程即可在 R 语言工作流中快速生成可重复、出版级表观基因组数据可视化图形的用户友好型软件包。
本文介绍了 DRSC 整合直系同源预测工具(DIOPT)的 2026 年更新,该工具通过整合多种算法预测结果、扩展物种覆盖范围、增强网页功能以及推出针对节肢动物的专用版本,持续为功能基因组学研究提供高效、可靠的跨物种直系同源基因映射资源。
TFBindFormer 是一种基于交叉注意力机制的混合 Transformer 模型,通过显式整合 DNA 序列特征与转录因子特有的蛋白质序列及结构信息,显著提升了大规模转录因子-DNA 结合预测的准确性与可扩展性。
本文提出了 CROssBARv2,这是一个统一的可扩展生物医学数据整合框架,它通过构建富含本体和向量化嵌入的知识图谱,并结合基于检索增强生成的 CROssBAR-LLM 问答系统,有效解决了数据孤岛问题并支持药物重定位、蛋白质功能预测等下游任务。
本研究通过整合分子对接与三级选择性策略,对近 63 万种天然产物进行大规模计算筛选,成功鉴定出 10 种能高效激活 Nrf2 通路且显著降低 PXR 和 CYP2D6 脱靶效应的新型候选药物,为开发更安全精准的氧化应激相关疾病疗法奠定了坚实基础。
该研究通过模拟实验系统评估了多种精度矩阵估计方法在差异共表达网络分析中的性能,发现数据特征显著影响评估结果,其中 GLassoElnetFast 表现最佳,并强调了全面基准测试对避免误导性结论及推动方法发展的重要性。
该研究通过整合转录组与 CRISPR 筛选数据发现,虽然性偏倚基因表达能在一定程度上预测性偏倚基因必需性,但大多数基因(尤其是 X 染色体基因)的性别依赖性差异主要由不依赖于表达水平的直接机制(如剂量效应)驱动,而非表达介导。
该研究通过对两个公开基准数据集的再分析,发现仅依靠结构和亲和力评分无法可靠预测从头设计蛋白结合剂的成功率,而引入基于自然蛋白训练的生物信息学特征(如聚集倾向、翻译后修饰位点等)作为上下文感知的筛选信号,不仅能揭示不同设计场景下的特异性规律,还能将筛选命中率提升近 2.8 倍,从而显著减少合成与测试的浪费。
本文提出了名为 DeSCOPE 的轻量级条件变分自编码器框架,该模型能够跨转录组、表观基因组及多模态数据准确预测基因扰动响应,并在未见基因、未见细胞类型及组合扰动等挑战性场景下显著优于现有基线方法,为设计改变细胞表型的疗法提供了通用且强大的虚拟细胞模型。