Viral non-coding RNA structure annotation and API-based data retrieval with Rfam and R2DT

本文提出了计算协议和实用示例,用于自动化病毒非编码RNA注释并通过其RESTful API编程检索Rfam数据,同时利用R2DT生成全面的二维结构可视化,以便整合到生物信息学和机器学习工作流中。

原作者: Muston, P., Triebel, S., Nawrocki, E., Ontiveros-Palacios, N., Jandalala, I., Sweeney, B., Bateman, A., Marz, M., Petrov, A. I., Madrigal, P.

发布于 2026-05-14
📖 1 分钟阅读☕ 轻松阅读

原作者: Muston, P., Triebel, S., Nawrocki, E., Ontiveros-Palacios, N., Jandalala, I., Sweeney, B., Bateman, A., Marz, M., Petrov, A. I., Madrigal, P.

原始论文采用 CC BY 4.0 许可(https://creativecommons.org/licenses/by/4.0/)。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

将病毒世界想象成一座庞大的操作手册图书馆。在这些手册中,有一些用一种名为“非编码 RNA"的密码写成的特殊章节。这些章节并不指导病毒如何构建蛋白质;相反,它们会折叠成特定的三维结构,充当微小的工具或开关,从而控制病毒的运作方式。

本文介绍了一套新工具和一本指南,旨在帮助科学家发现并理解这些秘密章节。以下是本文的拆解说明,采用了简单的类比:

1. 主蓝图(Rfam)
Rfam想象成一本关于这些 RNA 形状的巨大、高度有条理的百科全书。它不仅仅列出密码的字母;它为成千上万种不同的 RNA 类型提供“家庭相册”。对于每一个家族,它展示了它们共同呈现的平均形状(就像标准蓝图)以及它们折叠的规则。对于试图弄清楚这些神秘的 RNA 形状在科学家新发现的病毒基因组中起什么作用的科研人员来说,这本百科全书至关重要。

2. 自动化侦探(注释流程)
本文提出了一套供计算机使用的新型“侦探工具包”。科学家不再需要手动通读病毒整本操作手册来寻找这些 RNA 形状,这套工具包允许计算机自动扫描整个病毒基因组。它就像一个高速扫描仪,每当发现已知的 RNA 形状时就会将其高亮显示,并立即进行标记,使研究人员能够确切知道重要部分的位置。

3. 魔法绘图板(R2DT)
一旦计算机找到这些形状,就需要将它们呈现出来。本文介绍了R2DT,它就像一个魔法绘图板。你可以向它输入单个病毒的代码,或者一组不同病毒的集合(比对),它便会立即生成清晰、易读的 RNA 结构二维图。它将复杂、不可见的折叠模式转化为任何人都可以观看并理解的视觉地图。

4. 直通电话线(API)
最后,本文解释了如何通过一条名为API的“电话线”直接与 Rfam 百科全书对话。通常,你可能需要访问网站并点击许多页面才能获取数据。这种新方法允许计算机程序直接拨打 Rfam。研究人员可以提出具体问题,例如:“发送该 RNA 的家族详情”、“下载所有相似序列的列表”或“检查这个新的病毒序列是否与任何已知家族匹配”。百科全书会立即以适合分析的数据格式回复。

总结
本文本质上是一份供科学家使用的“操作指南”。它教导研究人员如何将 Rfam(百科全书)和 R2DT(绘图板)与直接数字连接(API)结合使用,以自动发现、可视化并研究病毒内部隐藏的 RNA 结构。这有助于研究人员将这些信息直接接入他们自己的计算机程序,比较不同的病毒,或将其用于训练人工智能系统。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →