MAJEC: unified gene, isoform, and locus-level transposable element quantification from RNA-seq
MAJEC 是一种统一的期望最大化框架,能够单次运行同时从 RNA-seq 数据中精准量化基因、转录本及转座元件(TE)位点,通过利用剪接接合证据有效解决 TE 与基因重叠导致的定量偏差,从而在精度和速度上均优于现有工具。
1235 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
MAJEC 是一种统一的期望最大化框架,能够单次运行同时从 RNA-seq 数据中精准量化基因、转录本及转座元件(TE)位点,通过利用剪接接合证据有效解决 TE 与基因重叠导致的定量偏差,从而在精度和速度上均优于现有工具。
该研究通过对人类蛋白质组进行大规模分析,将蛋白质结构抽象为接触网络并应用多种图机器学习方法,发现图核方法在区分酶与非酶蛋白任务中表现最佳,而图神经网络在多类别酶功能预测中展现出更优越的判别能力,从而验证了基于图的结构表示在蛋白质功能预测中的有效性。
本文提出了一种整合 HGNC 基因命名层级信息的层次感知基因探索平台,通过引入基于超扩散的相似性核,在乙酰氨基酚诱导的肝毒性案例研究中显著提升了转录组分析的生物学一致性与可解释性,成功识别出关键毒性模块及表观遗传调控机制。
该研究通过大规模基准测试揭示,现有单细胞药物响应模型在细胞系中表现较好但难以预测治疗前的内在耐药性,且在类别不平衡下性能显著下降,从而凸显了开发具有更强临床相关性、能应对肿瘤异质性和极端不平衡问题的下一代模型的迫切需求。
本文介绍了"found",这是一个用 Python 和 R 实现的 HiDDEN 方法框架,旨在从单细胞数据的结构化标签噪声中推断细胞级扰动,并通过基准测试表明其性能高度依赖于回归、分组和嵌入维度等建模选择。
本文提出了一种名为 CloneMLP-NPE 的基于模拟的贝叶斯推断框架,利用神经网络后验估计和归一化流技术,直接从单细胞测序拷贝数变异(CNA)谱中高效且准确地重构肿瘤内适应性景观并量化不确定性,其性能优于现有的基于集合 Transformer 和共识克隆的基线方法。
本文介绍了 BioClaw,这是一个将群聊转化为持久化执行工作空间的生物医学人机协作生态系统,它能够将群聊中的自然语言请求转化为基于隔离容器和丰富生物医学工具的自动化分析,从而支持跨多平台、多领域的高效科研协作。
本文介绍了 VCHarness,一种结合 AI 编码代理与多模态生物基础模型的自主系统,它能将虚拟细胞中扰动响应模型的构建时间从数月缩短至数天,并发现超越人工设计的非直观架构模式,从而推动细胞系统研究向自动化、可扩展的数据驱动范式转变。
该研究提出了一种残差比率审计框架,通过评估基因签名在背景表达结构中的正交性轨迹及其与随机基线的幅度差异,为转录组基因签名提供了一种独立于单一维度数值、可量化且稳健的评估方法,以区分生物学连贯的签名与任意基因组合。
GraphMana 是一种面向群体基因组学项目的原生图数据管理系统,它通过将变异数据存储为打包基因型数组并预计算群体统计信息,解决了传统基于文件的工作流在样本扩展、谱系追踪和重处理方面的局限性,在 1000 基因组项目测试中实现了从单一持久化数据库高效完成全生命周期操作的目标。