Integrative Multi-Scale Sequence-Structure Modeling for Antimicrobial Peptide Prediction and Design
本文提出了名为 MultiAMP 的整合多尺度序列 - 结构建模框架,通过协同利用进化、上下文及结构信息,显著提升了抗菌肽(AMP)的预测性能与可解释性,并成功实现了从海洋生物数据中挖掘高置信度新肽及基于梯度的理性设计。
1250 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文提出了名为 MultiAMP 的整合多尺度序列 - 结构建模框架,通过协同利用进化、上下文及结构信息,显著提升了抗菌肽(AMP)的预测性能与可解释性,并成功实现了从海洋生物数据中挖掘高置信度新肽及基于梯度的理性设计。
该研究提出了名为“空间机械组学”的新框架,结合生物原子力显微镜采样与开源计算平台 MechScape,实现了在完整组织尺度上对粘弹性力学状态的空间分辨测绘及其与多组学数据的整合,从而能够定量解析组织异质性并发现新的力学结构域。
本文提出了一种名为 TOASTER 的新方法,利用拓扑数据分析直接关联连续的空间蛋白表达与患者临床结果,从而克服了传统细胞分割和表型预测带来的误差,并在模拟和乳腺癌免疫治疗研究中证明了其更高的统计功效和鲁棒性。
本研究开发了名为 AbiOmics 的首个端到端机器学习流程,利用 1,243 个拟南芥转录组数据识别出 320 个胁迫特异性标记基因,成功实现了对盐、冷、热和干旱等多种非生物胁迫的高精度区分及复合胁迫信号的检测,为作物精准管理提供了超越传统表型感知的诊断工具。
本文提出了 MAP 框架,通过构建大规模细胞扰动知识图谱并采用知识驱动的预训练策略,将分子结构、蛋白序列与机制描述统一嵌入,从而实现了在缺乏实验数据的情况下对未表征药物诱导的单细胞响应进行零-shot 预测,显著提升了泛化能力并成功筛选出潜在的抗癌药物。
本文提出了一种名为 CO_SCPLOWILANTROC_SCPLOWO_SCPCAP-C_SCPCAPO_SCPLOWSLC_SCPLOW 的两阶段无图框架,该框架利用预训练生物基础模型和共形预测技术,在不依赖蛋白质相互作用网络或基因本体注释的情况下,实现了对合成致死基因对的高置信度预测及不确定性校准。
本文提出了一种名为 DENcode 的模型,该模型通过结合流行病学参数(如温度和时间)与基于病毒单倍型的遗传相似性,构建了概率化的登革热传播网络,从而更准确地推断病例间的传播联系并识别关键传播者。
本文提出了一种结合知识图谱与大语言模型的自主人工智能药物发现框架,该框架利用核心图技术从海量数据中提取透明假设,并能自主规划与执行多步骤靶点发现工作流。
本文提出了名为 Cuttlefish 3 的并行外部内存算法,通过三项核心创新实现了彩色压缩 de Bruijn 图的高效构建,其性能比现有最先进工具 GGCAT 快 3.29 至 4.09 倍,同时保持了相当的内存占用,从而显著提升了大规模基因组数据分析的可扩展性。
本文提出了名为 BioMiner 的多模态系统,通过分离生物活性语义解析与配体结构构建,结合化学结构感知的视觉语义推理技术,实现了从文献中自动化、高精度地挖掘蛋白质 - 配体生物活性数据,并建立了大规模基准数据集以验证其在构建数据库、辅助药物发现及加速基准测试等方面的显著实用价值。