A Bibliometric Review of Explainable AI in Diabetes Risk Prediction: Trends, Gaps, and Knowledge Graph Opportunities

本文通过对 1933 篇文献的文献计量分析,揭示了糖尿病风险预测中机器学习与可解释人工智能(XAI)结合领域的快速增长现状,指出了当前缺乏知识图谱(KG)整合的关键研究空白,并提出了将 KG 作为语义层融入 ML 与 XAI 的三层概念框架,以弥合统计解释与临床推理路径之间的差距。

原作者: Van, T. A.

发布于 2026-04-21
📖 1 分钟阅读☕ 轻松阅读

原作者: Van, T. A.

原始论文采用 CC BY 4.0 许可(https://creativecommons.org/licenses/by/4.0/)。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

这篇文章就像是一份**“糖尿病预测领域的探险地图”,作者 Thieu Anh Van 是一位侦探,他调查了全球关于“如何用人工智能(AI)预测糖尿病”的成千上万篇研究论文,发现了一个巨大的“知识断层”**,并提出了一个修补方案。

为了让你更容易理解,我们可以把整个研究过程想象成**“建造一座预测未来的智能医院”**。

1. 背景:为什么我们需要这座医院?

糖尿病(特别是 2 型糖尿病)就像一场全球性的“流行病风暴”,正在席卷世界各地。

  • 现状: 以前,医生靠经验判断谁可能得病。现在,我们有了机器学习(ML),就像一群超级聪明的**“算命机器人”**。它们看了几百万人的健康数据(身高、体重、血糖等),能非常精准地算出:“这个人明年得糖尿病的概率是 80%!”
  • 问题: 这些机器人虽然算得准,但它们是个**“黑盒子”。它们只告诉你结果(“高风险”),却不告诉你为什么**。就像你问机器人:“为什么说我高风险?”它只会说:“因为我的算法这么算的。”这对医生和患者来说太模糊了,医生不敢轻易相信,患者也听不懂。

2. 解决方案:给机器人装上“解释器”(XAI)

为了解决“黑盒子”问题,科学家们发明了**“可解释人工智能”(XAI)**。

  • 比喻: 这就像给算命机器人装了一个**“翻译官”**。
    • 以前:机器人说“高风险”。
    • 现在:翻译官说“高风险,因为你的**体重(BMI)**贡献了 30% 的风险,血压贡献了 20%..."
  • 现状: 作者调查了 2000 多篇论文,发现大家现在都在忙着给机器人装这种“翻译官”(主要是 SHAP 和 LIME 这两种工具)。研究热度像火箭一样飙升,从 2020 年的 36 篇猛增到 2025 年的 866 篇。

3. 核心发现:巨大的“知识断层”(KG 的缺失)

这是这篇论文最精彩的发现。作者发现,虽然“翻译官”很流行,但还缺了最关键的一环:“医学知识图谱”(Knowledge Graph, KG)

  • 比喻:
    • 目前的机器人(ML + XAI): 就像一个**“只会背数据的统计员”。它能告诉你“体重重导致风险高”,但它不懂医学原理**。它不知道“体重重”为什么会变成“糖尿病”。
    • 缺失的部分(KG): 这是一个**“医学图书馆”“病理地图”**。它记录了真实的医学链条:肥胖 → 胰岛素抵抗 → 血糖升高 → 糖尿病
  • 惊人的数据:
    • 在 2000 多篇论文中,有906 次提到了“解释器”(XAI)。
    • 但只有17 次(不到 1%)提到了“医学知识图谱”(KG)。
    • 差距: 这是一个53:1的巨大鸿沟!
    • 结论: 现在的研究都在拼命教机器人“怎么说话”(解释数据),却没人教它“懂医学道理”(结合病理知识)。

4. 为什么会有这个断层?

作者分析了原因,就像分析为什么没人去修那座桥:

  1. 太难了: 给机器人装“翻译官”很简单,写几行代码就行;但要构建“医学知识图谱”,需要懂复杂的医学数据库和图算法,门槛太高。
  2. 没标准: 大家没有统一的“医学地图”来测试,就像没有统一的试卷,大家不敢乱考。
  3. 习惯问题: 医生习惯了看简单的统计图表,还没准备好去读复杂的“病理链条”。

5. 作者提出的新方案:三层架构

作者没有止步于发现问题,他画了一张**“新医院”的设计图**,建议未来的研究应该包含三层:

  1. 第一层:预测层(The Predictor)
    • 角色: 超级算命机器人(如 XGBoost)。
    • 任务: 算出概率。
  2. 第二层:解释层(The Translator)
    • 角色: 翻译官(如 SHAP)。
    • 任务: 告诉你是哪个指标(如体重)导致了高风险。
  3. 第三层:知识层(The Doctor's Brain)
    • 角色: 医学图书馆(知识图谱)。
    • 任务: 这是作者最想要的创新点! 它把第二层的“体重”和医学知识连起来。
    • 最终效果: 机器人不再只说“体重高”,而是说:“因为您的体重过高,导致了胰岛素抵抗(这是医学原理),进而引发了血糖升高,所以您有高风险。”

6. 总结与启示

  • 现状: 我们造出了跑得飞快的赛车(预测模型),也装上了很好的导航(解释器),但还没装上懂路况的司机(医学知识)
  • 未来方向: 作者呼吁,未来的研究不能只盯着“算得准不准”,更要让 AI**“懂医学”**。只有把数据预测和医学原理结合起来,AI 才能真正走进医院,帮助医生做决策,而不是仅仅作为一个冷冰冰的计算器。

一句话总结:
这篇论文告诉我们,现在的 AI 医生虽然能算出你“会不会得病”,但它还像个只会背书的实习生,不懂“为什么会得病”。未来的方向是给它装上**“医学大脑”**,让它不仅能算数,还能像老专家一样讲出背后的病理故事。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →