pHapCompass: Probabilistic Assembly and Uncertainty Quantification of Polyploid Haplotype Phase
本文提出了名为 pHapCompass 的概率性多倍体单倍型组装算法,该算法通过显式建模读段分配歧义性来量化相位不确定性,并配套开发了针对自交和异源多倍体的真实基因组模拟工作流及评估指标,从而在复杂多倍体基因组中实现了具有竞争力的组装性能与准确的相位不确定性量化。
60 篇论文
本文提出了名为 pHapCompass 的概率性多倍体单倍型组装算法,该算法通过显式建模读段分配歧义性来量化相位不确定性,并配套开发了针对自交和异源多倍体的真实基因组模拟工作流及评估指标,从而在复杂多倍体基因组中实现了具有竞争力的组装性能与准确的相位不确定性量化。
本文提出了一种名为等变异步扩散(EAD)的新型模型,通过引入自适应的动态去噪调度机制,有效结合了异步自回归与同步扩散模型的优势,从而在捕捉分子层级因果关系的同时实现了分子级生成视野,显著提升了三维分子构象生成的性能。
该论文提出了一种利用随机束搜索对蛋白质掩码语言模型进行高效采样的灵活方法,并通过体外抗体工程实验证明,采样策略的选择对优化结果的影响至少与模型本身相当。
该研究通过分析美国 1.4 万余名青年在新冠疫情期间五个阶段的重复横截面数据,发现尽管症状网络的整体模块化架构保持稳定,但模块间的控制力却从早期以压力相关症状为中心转变为后期在情感、认知和社会领域更广泛分布的模式,表明长期危机可能重塑了症状间的控制机制而非破坏其基础结构。
该论文介绍了 LabConstrictor 这一基于 GitHub 的自动化工具,它通过将 Jupyter 笔记本打包为可一键安装的桌面应用程序,解决了生命科学领域开源软件因环境依赖复杂和分发困难而难以普及的问题,从而促进了计算方法的快速应用与复用。
本文提出了一种名为 TCR-EML 的可解释模型层,通过将基于已知 TCR-pMHC 结合机制的氨基酸残基接触原型嵌入蛋白质语言模型骨干,在保持预测竞争力的同时显著提升了 TCR-pMHC 结合预测的可解释性。
该研究通过 AI 驱动的自主大规模假设筛选,证实了生物基础模型(如 scGPT 和 Geneformer)在单细胞基因表达数据中确实学习到了具有生物学意义的非平凡几何与拓扑结构,且这种结构在不同独立训练的模型间表现出全局一致性,但在不同组织类型中的信号强度存在显著差异。
该论文提出了一种通过批处理超图估计和共享权重图卷积层增强 CNN 自编码器潜在表示的无监督医学异常检测方法,利用正常队列的上下文相似性生成群体感知嵌入,从而在脑肿瘤 MRI 数据集上显著降低了假阳性率并提升了检测精度。
本文提出了一种名为 PPCMI-SF 的隐私保护协作医疗图像分割框架,该框架通过结合跳连自编码器与客户端特定的密钥潜在变换,在无需共享原始数据的前提下,实现了多机构间的高精度、抗攻击且低通信开销的实时分割任务。
该研究结合实验与数学建模,揭示了脉冲电场作用下多细胞肿瘤球体中损伤相关分子模式(DAMP)释放的时空动态及中间场强下因静止细胞存活而导致的加速再生现象,强调了在电穿孔疗法设计中考虑静止细胞的重要性。
本文提出了名为 AllScAIP 的可扩展注意力机制机器学习势函数,通过引入全连接节点注意力组件以数据驱动方式有效捕捉长程相互作用,在无需显式物理项的情况下实现了分子、材料及催化体系的高精度预测与稳定长时程分子动力学模拟。
drGT 是一种基于药物 - 细胞 - 基因异质网络的图深度学习模型,它利用注意力系数不仅在高精度下预测药物反应,还能有效识别已知及文献支持的生物标志物并解析受影响的生物学过程,从而显著提升了药物敏感性预测的可解释性。
本文提出了一种基于弱形式参数估计的实用可辨识性准则(e, q-可辨识性),该方法利用微分代数技术生成弱形式输入输出方程并结合 WENDy 算法,能够在处理含未观测变量和噪声数据的系统时,比传统输出误差法更快速、稳健地评估参数估计质量。
该论文指出传统基于状态伪随机数生成器的“公共随机数”方法因执行路径依赖导致因果结构不连贯,并提出结合基于计数器的随机数生成器与事件标识符的解决方案,以通过事件索引恢复随机数生成的因果一致性。
该论文提出了单分子定位显微镜挑战(SMLM-C)基准数据集,用于评估状态空间模型在生物成像稀疏随机时序数据上的表现,并发现其在处理重尾闪烁动力学导致的时序不连续性时性能显著下降,从而揭示了现有模型在科学成像领域面临的根本性挑战。
该论文通过系统生物学案例研究,揭示了基于字典的动态方程学习中因候选函数强相关性导致的病态问题及其对模型恢复的负面影响,并指出正交多项式基仅在数据分布与权重函数匹配时才能有效改善数值条件并提升模型精度。
该论文提出了一种结合精确聚类大小检索与高斯随机场解析推断的混合 eTFCE-GRF 方法,在无需置换检验的情况下实现了体素形态学分析中严格的族错误率控制,并将计算速度提升了数十至千倍。
该论文引入了一种作用于参数和状态且保持观测输出不变的“参数 - 状态对称性”子群,证明了局部结构可辨识的参数组合与局部结构可观测的状态分别对应于这些对称性的通用不变量,从而为分析动力学系统的结构性质提供了一种统一的对称性框架。
该论文提出了名为 Sorometry 的端到端人工智能管道,通过融合 ConvNeXt 与 PointNet++ 模型处理 2D 图像和 3D 点云数据,并结合贝叶斯混合建模,实现了植物硅酸体(phytoliths)的高通量自动化分类与群落组成分析,从而将传统耗时的显微分析转变为可规模化、标准化的“组学”级研究范式。
本文介绍了 Nyxus,这是一个专为处理海量 2D 和 3D 图像数据而设计的下一代特征提取库,它通过支持 CPU/GPU 可扩展计算、提供多种用户接口(如 Python 包、命令行工具、Napari 插件及容器化部署)以及覆盖生物医学多领域的全面特征集,旨在解决大规模图像分析中的效率瓶颈并提升特征提取的标准化与灵活性。