Uncertainty-aware graph representation learning with positive-unlabeled classification for biomarker discovery in peripheral artery disease

本文提出了一种不确定性感知的图表示学习框架,该框架整合了正-未标记分类与集成方法,以优先筛选针对外周动脉疾病的新型且校准良好的生物标志物,其预测性能与生物学相关性均优于现有基线模型。

原作者: Ayyalasomayajula, V. S. R. K., Senders, M. L., Wolterink, J. M., Yeung, K. K.

发布于 2026-05-13
📖 1 分钟阅读☕ 轻松阅读

原作者: Ayyalasomayajula, V. S. R. K., Senders, M. L., Wolterink, J. M., Yeung, K. K.

原始论文采用 CC BY 4.0 许可(https://creativecommons.org/licenses/by/4.0/)。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

将外周动脉疾病(PAD)想象成一座庞大而错综复杂的城市道路网(我们的血管),其中一些街道被堵塞,但我们并不完全清楚它们为何被堵。科学家已知少数关键肇事者(“阳性”蛋白质),但对于城市的大部分区域,交通报告要么缺失,要么不完整。这使得寻找解决问题的新线索变得非常困难。

大多数试图解决这一问题的计算机程序就像过于自信的导游。它们指着一座随机建筑说:“这绝对是问题所在!”却不愿承认自己可能只是在猜测。它们不知道何时自己不确定,而且常常错过那些与它们以往所见不同的、新奇而陌生的建筑。

新方法:一位手持水晶球的谨慎侦探

本文的研究人员构建了一个更智能的系统,就像一位携带“置信度计”和“新颖性雷达”的谨慎侦探。以下是他们的方法:

  1. 绘制城市地图(图学习):首先,他们使用一种特殊的人工智能(图神经网络)来创建体内所有蛋白质相互连接的三维地图。这就像绘制一张地铁图,其中站点之间的距离代表不同蛋白质之间的关联程度。
  2. “是、可能、否”团队(集成预测):他们不是依赖单一侦探,而是聘请了一整支由不同专家(五个不同的分类器)组成的团队,并让他们投票表决。他们还教导这些专家在数据模糊时说出“我不确定”。这就形成了一个“置信度计”,告诉我们系统对其答案的把握程度。
  3. 两个篮子(不确定性与新颖性):系统将潜在线索分为两堆:
    • “稳妥之选”:这些候选对象与已知肇事者非常相似。系统对这些候选对象非常有信心。
    • “新发现”:这些候选对象位于地图上陌生且未探索的区域。系统将它们标记为“结构上新颖”,因为它们不符合通常的模式,暗示它们可能是我们尚未想到的新型肇事者。

他们的发现

研究团队测试了这一系统,发现其表现远优于旧方法。虽然旧有的“过于自信”的导游在约 82% 的情况下是正确的,但新团队的正确率达到了约 92%。

  • 稳妥之选:系统最有信心的那些蛋白质与已知的 PAD 蛋白质聚集在一起。它们参与熟悉的任务,如构建道路墙壁(细胞外基质)和管理血液凝固(凝血)。
  • 新发现:“新颖”候选对象位于地图上不同的街区。它们与不同类型的交通控制相关,例如细胞信号传导和免疫系统反应(G 蛋白偶联受体和 NF-κB 通路)。

核心结论

通过教会计算机在不确定时承认这一点,并寻找与常态不同的事物,研究人员成功识别出 100 种新的 PAD 潜在生物标志物。他们证明,将“置信度”与“好奇心”相结合,有助于科学家发现明显的嫌疑对象和隐蔽的嫌疑对象,从而获得对该疾病更清晰的图景。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →