Statistical detection of protein sites associated with continuous traits
本文提出了一种基于系统发育模型的统计方法,用于检测与连续性状(如寿命)相关的蛋白质位点,并通过模拟和实证分析表明该方法在保持低假阳性率的同时提高了召回率,尽管计算成本较高,但结合简单筛选策略可有效应用于全基因组扫描。
1243 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文提出了一种基于系统发育模型的统计方法,用于检测与连续性状(如寿命)相关的蛋白质位点,并通过模拟和实证分析表明该方法在保持低假阳性率的同时提高了召回率,尽管计算成本较高,但结合简单筛选策略可有效应用于全基因组扫描。
该研究通过整合多组学数据并利用可解释性机器学习模型,揭示了大豆在干旱胁迫下由异黄酮衍生物大豆苷和耐旱微生物(如 Candidatus Nitrosocosmicus)介导的根际互作机制及其对表型变异的驱动作用。
本文介绍了 Cenote-Taker 3 这一命令行工具,它通过集成病毒发现、前噬菌体提取及基因注释模块,能够高效、准确地从基因组或宏基因组组装数据中识别病毒并注释其基因,且在速度和精度上优于多数同类工具。
该研究提出了名为 PATTY 的计算方法,通过整合 ATAC-seq 数据利用机器学习校正 CUT&Tag 技术中由 Tn5 转座酶偏好性引起的开放染色质偏差,从而显著提升了体细胞及单细胞水平上组蛋白修饰位点检测的准确性与细胞聚类的可靠性。
本文提出了 PRISM-G,一种可解释的模型无关隐私评分框架,通过整合邻近性、亲缘关系和性状关联三个维度来量化合成人类基因组数据的隐私风险,并验证了不同生成模型在隐私脆弱性上的差异。
本研究通过全原子分子动力学模拟,系统解析了人源 CFTR 蛋白在有无 VX-770 结合状态下与脂质环境及阴离子的静电相互作用网络,揭示了这些动态网络在稳定蛋白结构、介导离子传导及调控变构机制中的关键作用。
本文提出了 HEDeST,一种将组织学形态特征与去卷积比例相结合的弱监督框架,旨在克服空间转录组技术缺乏单细胞分辨率的局限,从而在单细胞水平上实现更精准、鲁棒且可扩展的细胞类型定位与微环境分析。
本文提出了一种名为 DVPNet 的新型可解释遗传分析框架,该框架结合 Nucleotide Transformer 与概率电路,通过量化基因对区分肺癌细胞与正常细胞的贡献度,揭示了超越传统统计方法的生物学特征及关键致癌基因。
ADAMIXTURE 是一种将自适应矩估计(Adam)与期望最大化(EM)算法相结合的新型优化框架,它利用一阶梯度近似曲率信息,在保持推断精度的同时显著降低了计算复杂度,从而在大规模生物库遗传聚类任务中实现了比现有最先进方法快两个数量级的加速。
该研究通过整合单分子脱氨酶足迹技术(FOODIE)与 AlphaGenome 变异效应预测工具 varTFBridge,成功在 49 万余个 UK Biobank 基因组中鉴定出 113 个高置信度非编码变异,揭示了其通过破坏转录因子结合进而重编程基因调控网络并影响红细胞性状的分子机制。