Towards inferring atomic scale conformation landscape of biomolecules from cryo-electron tomography data
本文提出了名为 DeepMDTOMO 的深度学习框架,通过结合 3D 卷积特征提取与多层感知机,有效克服了冷冻电子断层扫描数据中的高噪声和缺失楔效应,实现了从亚断层图中快速、准确地推断生物分子的原子级构象景观。
1250 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文提出了名为 DeepMDTOMO 的深度学习框架,通过结合 3D 卷积特征提取与多层感知机,有效克服了冷冻电子断层扫描数据中的高噪声和缺失楔效应,实现了从亚断层图中快速、准确地推断生物分子的原子级构象景观。
本文提出了名为 SomaSV 的混合测序框架,通过整合 30x 肿瘤长读长数据与包含 10x 长读长及 30x 短读长的匹配正常样本数据,在显著降低测序成本的同时实现了比现有方法更准确的体细胞结构变异检测,并有助于发现潜在的癌症生物标志物。
本研究通过生物信息学分析揭示了桥本甲状腺炎与 2 型糖尿病共享的分子特征及免疫相关通路,并筛选出格列喹酮、齐墩果酸和格列吡嗪等潜在老药新用候选药物,为理解两病共存的机制及未来治疗策略提供了理论依据。
该研究利用 TCGA 患者数据系统评估了多种从临床前细胞系到临床场景的化疗反应预测迁移学习策略,发现大多数直接迁移方法效果不佳,而基于微调或融合临床前预测结果的混合策略则能提供更稳定可靠的性能提升。
本文介绍了 rustybam(基于 Rust 的命令行工具)和 SafFire(基于浏览器的交互式可视化工具),前者用于处理 PAF 和 BAM 比对数据,后者用于基因组比较可视化,两者共同构成了一个用于比对分析与可视化的可组合工具包。
本文提出了一种空间对齐随机划分(SARP)模型,通过贝叶斯非参数方法在保留基因表达特征独立性的同时引入空间依赖,从而有效识别肿瘤、免疫及基质细胞亚群在空间上的共定位关系,并成功应用于结直肠癌数据分析以发现与特定肿瘤区域对齐的细胞亚型。
该研究提出了名为 ExCALIBR 的半监督框架,通过利用偏态正态混合模型对 39 个基因的 80 个高通量功能数据集进行校准,将实验评分转化为致病概率,从而显著优于现有标准并有望大幅减少临床变异分类中的意义未明变异。
本文介绍了 resLens,这是一种利用预训练 DNA 语言模型微调而成的基因组语言模型家族,旨在通过捕捉潜在基因组表征来克服传统比对方法的局限,从而更精准地检测和分析抗生素耐药基因。
该论文提出了利用生物世界模型作为软验证器的新范式,通过强化学习训练出名为 rbio1 的生物推理模型,使其无需额外实验数据即可在扰动预测等任务上达到最先进水平,并展示了跨领域零样本迁移能力。
DupyliCate 是一款用于挖掘、分类和表征基因复制事件的高通量 Python 工具,其通过灵活参数和物种特异性阈值,在拟南芥、多种植物及非植物模式生物数据集上成功验证了其在解析基因复制与性状进化(如类黄酮合成相关基因)方面的广泛适用性。