📄 health informatics

A Bibliometric Review of Explainable AI in Diabetes Risk Prediction: Trends, Gaps, and Knowledge Graph Opportunities

本文通过对 1933 篇文献的文献计量分析，揭示了糖尿病风险预测中机器学习与可解释人工智能（XAI）结合领域的快速增长现状，指出了当前缺乏知识图谱（KG）整合的关键研究空白，并提出了将 KG 作为语义层融入 ML 与 XAI 的三层概念框架，以弥合统计解释与临床推理路径之间的差距。

原作者： Van, T. A.

发布于 2026-04-21

📖 1 分钟阅读☕ 轻松阅读

CC BY 4.0

原作者： Van, T. A.

原始论文采用 CC BY 4.0 许可（https://creativecommons.org/licenses/by/4.0/）。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。阅读完整免责声明

这篇文章就像是一份**“糖尿病预测领域的探险地图”，作者 Thieu Anh Van 是一位侦探，他调查了全球关于“如何用人工智能（AI）预测糖尿病”的成千上万篇研究论文，发现了一个巨大的“知识断层”**，并提出了一个修补方案。

为了让你更容易理解，我们可以把整个研究过程想象成**“建造一座预测未来的智能医院”**。

1. 背景：为什么我们需要这座医院？

糖尿病（特别是 2 型糖尿病）就像一场全球性的“流行病风暴”，正在席卷世界各地。

现状： 以前，医生靠经验判断谁可能得病。现在，我们有了机器学习（ML），就像一群超级聪明的**“算命机器人”**。它们看了几百万人的健康数据（身高、体重、血糖等），能非常精准地算出：“这个人明年得糖尿病的概率是 80%！”
问题： 这些机器人虽然算得准，但它们是个**“黑盒子”。它们只告诉你结果（“高风险”），却不告诉你为什么**。就像你问机器人：“为什么说我高风险？”它只会说：“因为我的算法这么算的。”这对医生和患者来说太模糊了，医生不敢轻易相信，患者也听不懂。

2. 解决方案：给机器人装上“解释器”（XAI）

为了解决“黑盒子”问题，科学家们发明了**“可解释人工智能”（XAI）**。

比喻： 这就像给算命机器人装了一个**“翻译官”**。
- 以前：机器人说“高风险”。
- 现在：翻译官说“高风险，因为你的**体重（BMI）**贡献了 30% 的风险，血压贡献了 20%..."
现状： 作者调查了 2000 多篇论文，发现大家现在都在忙着给机器人装这种“翻译官”（主要是 SHAP 和 LIME 这两种工具）。研究热度像火箭一样飙升，从 2020 年的 36 篇猛增到 2025 年的 866 篇。

3. 核心发现：巨大的“知识断层”（KG 的缺失）

这是这篇论文最精彩的发现。作者发现，虽然“翻译官”很流行，但还缺了最关键的一环：“医学知识图谱”（Knowledge Graph, KG）。

比喻：
- 目前的机器人（ML + XAI）： 就像一个**“只会背数据的统计员”。它能告诉你“体重重导致风险高”，但它不懂医学原理**。它不知道“体重重”为什么会变成“糖尿病”。
- 缺失的部分（KG）： 这是一个**“医学图书馆”或“病理地图”**。它记录了真实的医学链条：肥胖 → 胰岛素抵抗 → 血糖升高 → 糖尿病。
惊人的数据：
- 在 2000 多篇论文中，有906 次提到了“解释器”（XAI）。
- 但只有17 次（不到 1%）提到了“医学知识图谱”（KG）。
- 差距： 这是一个53:1的巨大鸿沟！
- 结论： 现在的研究都在拼命教机器人“怎么说话”（解释数据），却没人教它“懂医学道理”（结合病理知识）。

4. 为什么会有这个断层？

作者分析了原因，就像分析为什么没人去修那座桥：

太难了： 给机器人装“翻译官”很简单，写几行代码就行；但要构建“医学知识图谱”，需要懂复杂的医学数据库和图算法，门槛太高。
没标准： 大家没有统一的“医学地图”来测试，就像没有统一的试卷，大家不敢乱考。
习惯问题： 医生习惯了看简单的统计图表，还没准备好去读复杂的“病理链条”。

5. 作者提出的新方案：三层架构

作者没有止步于发现问题，他画了一张**“新医院”的设计图**，建议未来的研究应该包含三层：

第一层：预测层（The Predictor）
- 角色： 超级算命机器人（如 XGBoost）。
- 任务： 算出概率。
第二层：解释层（The Translator）
- 角色： 翻译官（如 SHAP）。
- 任务： 告诉你是哪个指标（如体重）导致了高风险。
第三层：知识层（The Doctor's Brain）
- 角色： 医学图书馆（知识图谱）。
- 任务： 这是作者最想要的创新点！ 它把第二层的“体重”和医学知识连起来。
- 最终效果： 机器人不再只说“体重高”，而是说：“因为您的体重过高，导致了胰岛素抵抗（这是医学原理），进而引发了血糖升高，所以您有高风险。”

6. 总结与启示

现状： 我们造出了跑得飞快的赛车（预测模型），也装上了很好的导航（解释器），但还没装上懂路况的司机（医学知识）。
未来方向： 作者呼吁，未来的研究不能只盯着“算得准不准”，更要让 AI**“懂医学”**。只有把数据预测和医学原理结合起来，AI 才能真正走进医院，帮助医生做决策，而不是仅仅作为一个冷冰冰的计算器。

一句话总结：
这篇论文告诉我们，现在的 AI 医生虽然能算出你“会不会得病”，但它还像个只会背书的实习生，不懂“为什么会得病”。未来的方向是给它装上**“医学大脑”**，让它不仅能算数，还能像老专家一样讲出背后的病理故事。

A Bibliometric Review of Explainable AI in Diabetes Risk Prediction: Trends, Gaps, and Knowledge Graph Opportunities

1. 背景：为什么我们需要这座医院？

2. 解决方案：给机器人装上“解释器”（XAI）

3. 核心发现：巨大的“知识断层”（KG 的缺失）

4. 为什么会有这个断层？

5. 作者提出的新方案：三层架构

6. 总结与启示

1. 研究背景与问题陈述 (Problem)

2. 方法论 (Methodology)

3. 关键发现与结果 (Key Results)

4. 主要贡献 (Key Contributions)

5. 意义与展望 (Significance)

1. 背景：为什么我们需要这座医院？

2. 解决方案：给机器人装上“解释器”（XAI）

3. 核心发现：巨大的“知识断层”（KG 的缺失）

4. 为什么会有这个断层？

5. 作者提出的新方案：三层架构

6. 总结与启示

1. 研究背景与问题陈述 (Problem)

2. 方法论 (Methodology)

3. 关键发现与结果 (Key Results)

4. 主要贡献 (Key Contributions)

5. 意义与展望 (Significance)

类似论文