BiOS: An Open-Source Framework for the Integration of Heterogeneous Biodiversity Data
本文介绍了 BiOS(生物多样性观测系统),这是一个遵循 FAIR 原则的开源模块化框架,通过解耦后端数据管理与前端展示层,提供 API 和可视化界面,有效整合了从分类学到遗传学等异构生物多样性数据,以解决数据碎片化问题并促进协作保护。
1244 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文介绍了 BiOS(生物多样性观测系统),这是一个遵循 FAIR 原则的开源模块化框架,通过解耦后端数据管理与前端展示层,提供 API 和可视化界面,有效整合了从分类学到遗传学等异构生物多样性数据,以解决数据碎片化问题并促进协作保护。
本文提出了 SC-BIG,一种利用批量测序数据、通过分层贝叶斯模型联合估计癌症细胞分数并量化不确定性的新方法,从而显著提高了单细胞测序中体细胞单核苷酸变异检测的准确性。
该研究通过构建包含 63 个真实组织切片和 1000 多个半合成数据集的综合性基准,系统评估了 26 种空间域检测方法,揭示了数据分辨率和细胞异质性对性能的关键影响,并提出了一个模块化基准框架以指导未来工具的优化与选择。
本文介绍了一种基于 BioBERT 的 Transformer 语言模型及其在 CIPHER 平台上的集成应用,通过滑动窗口技术实现了对包含可计算表型定义的生物医学文献的高精度自动识别,并构建了支持用户反馈闭环的自适应系统以加速表型驱动的文献策展工作。
该研究通过整合大规模脂质组学与全基因组关联分析,解析了高粱籽粒油脂含量的复杂遗传架构,鉴定出 55 个关键位点及 27 份优良种质资源,为利用标记辅助选择改良高粱籽粒品质提供了重要理论基础和育种材料。
本文提出了一种名为 ITEC 的全无监督迭代追踪与纠错方法,能够以超过 99.7% 的精度从海量数据中自动重建跨物种(如斑马鱼、小鼠和果蝇)胚胎的完整细胞谱系与命运图谱,从而为解析发育动力学提供了强有力的平台。
本研究开发了名为 scPloidyR 的隐马尔可夫模型,通过联合建模 Tapestri 单细胞靶向测序中的读段深度和 B 等位基因频率信号,显著提升了拷贝数变异的检测精度,并证明了在具备等位基因信息时该方法优于仅依赖深度的现有工具,而在缺乏该信息时深度单一模型则更为适用。
本文介绍了 SpotGraphs 这一 R 语言包,它基于 igraph 基础设施,为空间转录组数据提供了比现有流程更直接、灵活的图结构交互能力,支持用户自定义邻接关系、过滤低质量斑点及分析特定空间邻域,其功能与性能与 Python 的 SquidPy 包相当。
该研究提出了一种基于氨基酸二维结构图像的化学信息表征方法,通过卷积自编码器直接学习理化特征,从而突破了传统固定字母表的限制,实现了对非标准氨基酸及翻译后修饰的泛化预测与可解释性分析。
UniST 是一个统一的生成式人工智能框架,通过整合点云上采样、光流插值和图自编码器等技术,能够从稀疏且不连续的二维切片数据中高效重建出致密且连续的三维空间转录组景观,从而在无需改变现有实验技术的前提下,解决组织三维结构重构中的关键挑战。