METRIN-KG: A knowledge graph integrating plant metabolites, traits, and biotic interactions
本文介绍了 METRIN-KG,这是一个整合植物代谢组、性状及生物互作等多源异构数据的知识图谱,旨在通过提供交互式查询接口来促进生命科学领域的研究创新。
1235 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文介绍了 METRIN-KG,这是一个整合植物代谢组、性状及生物互作等多源异构数据的知识图谱,旨在通过提供交互式查询接口来促进生命科学领域的研究创新。
该研究提出了一种名为 TEAMKidney 的深度学习框架,通过结合自训练语义分割与针对透射电镜优化的全景分割模型,实现了对跨物种、跨设备肾脏超微结构的高效、准确自动分割与量化,显著降低了人工分析负担并达到了病理专家级的测量精度。
本文提出了 PeptideCLM-2,这是一种基于 1 亿多分子数据训练的化学语言模型套件,旨在填补现有模型在治疗性肽类药物开发中的空白,通过原生表示复杂肽化学特性,显著提升了膜扩散、肿瘤归巢及半衰期等关键开发指标预测的准确性。
该研究提出了一种由智能体引导的从头设计工作流,通过结合热点预测、多方法生成及多指标筛选,成功针对一种新型癌症靶点设计了无需实验结构或先验抗体信息的纳米抗体,并在实验验证中获得了 39.7% 的高成功率及纳摩尔级结合亲和力。
该研究通过不确定性感知基准测试和扩展特征分析,揭示了 mRNA 与 lncRNA 分类中大量转录本存在歧义,并阐明了导致分类器分歧和误判的关键序列特征。
本文介绍了 PathwaySeeker,一种基于证据的 AI 系统,它通过整合蛋白质组与代谢组数据构建物种特异性代谢网络,并利用“循环神谕”推理机制将大语言模型的生成能力与实验证据溯源相结合,从而在特定实验条件下实现对代谢路径的精准推理与假设验证。
本文介绍了 cellNexus,这是一个旨在将人类细胞图谱转化为分析就绪数据的综合工具与资源,它通过提供标准化的质量控制、注释增强、归一化及分析层,实现了跨研究的稳健统计建模,并支持通过多种接口访问,从而为大规模生物学发现和下一代单细胞基础模型奠定了可重复且互操作的基础。
本文提出了一种名为 UDAL 的基于不确定性和多样性的主动学习策略,通过结合 MC Dropout 与核心集选择,在有限的湿实验预算下显著提升了 TCR-pMHC 结合预测模型的效率,从而大幅降低了 T 细胞疗法发现中的实验验证成本。
本文提出了名为 FairTCR 的公平性感知框架,通过群体分布鲁棒优化(GDRO)显著降低了 TCR-pMHC 结合预测中不同 HLA 等位基因和人群队列间的性能差距,在保持整体预测精度的同时有效提升了罕见等位基因及少数族裔群体的预测公平性。
本文提出了一种名为 RRE 的递归重复扩展器,该方法利用隐马尔可夫模型(HMM)和高敏感度的递归搜索策略,有效克服了传统算法在检测高度退化和碎片化重复元件时的局限性,从而能够自动生成更完整、覆盖度更高的重复序列模型库。