ETSAM: Effectively Segmenting Cell Membranes in cryo-Electron Tomograms
本文提出了一种基于 SAM2 微调的两阶段人工智能方法 ETSAM,通过在混合实验与模拟数据集上的训练,有效克服了冷冻电子断层扫描图像中的低信噪比和缺失楔形伪影等挑战,实现了对细胞膜的高精度分割,其性能显著优于现有深度学习方法。
768 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文提出了一种基于 SAM2 微调的两阶段人工智能方法 ETSAM,通过在混合实验与模拟数据集上的训练,有效克服了冷冻电子断层扫描图像中的低信噪比和缺失楔形伪影等挑战,实现了对细胞膜的高精度分割,其性能显著优于现有深度学习方法。
该论文提出基于部分信息分解的“协同信息分数”(SIS)指标,揭示传统对齐目标仅能捕捉线性冗余,论证了构建面向“虚拟细胞”的多模态基础模型需从强调共享结构的对齐转向最大化互补信号的协同整合。
该研究通过构建基于加权基尔霍夫拉普拉斯矩阵和矩阵树定理的生成树配分函数,将高斯网络模型推广至连续玻尔兹曼加权系综,揭示了 KRAS 激活是一个由 Switch I 区域主导、通过构象熵增益补偿能量代价的熵驱动过程。
本文介绍了 Graph Lens Lite,这是一款基于浏览器的交互式生物网络可视化工具,旨在通过丰富的可视化功能、拓扑分析、灵活过滤及共享能力,辅助研究人员探索疾病病理生物学机制及药物作用模式。
ToxiVerse 是一个面向缺乏编程经验研究人员的免费公共网络平台,它通过整合生物特征分析、 curated 毒性数据库和自动 QSAR 建模三大模块,实现了化学毒性数据的共享与定制化预测分析。
该研究通过基准测试评估了针对 G 蛋白偶联受体(GPCR)的生成式从头多肽设计方法,发现尽管现有深度学习工具在多肽骨架采样方面表现尚可,但在验证阶段普遍存在置信度高估和序列生成能力不足的问题,揭示了当前多肽设计流程中评分机制失效及模型记忆化等关键挑战。
本文介绍了 SpatialLeiden 算法的扩展版本,该算法通过基于批次校正潜在空间的灵活邻接图复用,实现了支持 3D 序列切片及多模态数据的 atlas 级大规模空间聚类,在标准硬件上展现出卓越的模块化、可扩展性及与脑图谱的一致性,并兼容 scverse 生态以促进广泛采用。
HMM-Flagger 是一种基于隐马尔可夫模型和读段覆盖度的无参考基因组组装错误检测工具,能够有效识别结构异常,并在 HG002 及人类泛基因组参考联盟(HPRC)的组装评估中成功揭示了包括卫星区域在内的多种大规模错误并验证了新型结构变异。
本文介绍了 TreeMS2 这一可扩展的计算工具,它通过直接比较串联质谱(MS/MS)谱图来构建相似性矩阵,从而在不依赖谱图注释的情况下,从蛋白质组和代谢组数据中推断出反映分子表型进化关系及功能适应的分子系统发育树。
本文提出了一种名为 STEQ 的新方法,该方法基于统计一致的四分体距离度量,能够在多物种溯祖模型下以 的线性时间复杂度快速且准确地从大量基因树中推断物种树,其速度优于 ASTRAL 等主流方法同时保持了相当的准确性。