Engineering FAIR Privacy-preserving Applications that Learn Histories of Disease

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个非常酷的工程故事：如何把原本需要放在“超级电脑”里运行的复杂医疗 AI，变成一个完全在你自己浏览器里运行的“隐私小助手”，而且不用上传任何数据。

为了让你更容易理解，我们可以把这篇论文的内容想象成**“把一家顶级医院的诊断室，搬进了你的家里”**。

1. 核心问题：为什么以前很难？

想象一下，你想知道自己未来几十年可能会生什么病（比如心脏病、糖尿病等），以便提前预防。

以前的做法：你需要把你所有的病历、体检报告（这些是非常私密的“家庭日记”）打包，寄给一家拥有超级大脑的“云端医院”。他们分析完后，告诉你结果。
痛点：这就像把日记本寄给陌生人看。虽然他们很专业，但你担心隐私泄露，或者担心数据被滥用。而且，如果网络断了，或者医院服务器太忙，你就用不了。

2. 他们的解决方案：把“超级大脑”装进浏览器

这篇论文的团队做了一件很厉害的事：他们把那个“云端医院”的超级大脑（一个叫做 Delphi 2M 的 AI 模型），直接缩小并打包，塞进了你普通的网页浏览器里。

现在，你不需要把病历寄给任何人。你只需要打开网页，输入你的健康历史，计算过程完全发生在你自己的电脑或手机里。就像你在家自己读日记并做笔记，外人完全不知道你在想什么。

3. 他们是怎么做到的？（三个关键步骤）

为了把这个巨大的“云端大脑”塞进小小的浏览器，他们用了三个神奇的“魔法道具”：

🪄 道具一：ONNX（万能翻译官）

比喻：原来的 AI 模型是用一种叫 PyTorch 的“方言”写的，就像只有法国人才能听懂。但浏览器只懂“英语”（JavaScript/WebAssembly）。
作用：ONNX 就像一个超级翻译官。它把 AI 模型从“法语”翻译成通用的“世界语”。这样，不管你的电脑是 Windows、Mac 还是手机，都能听懂这个模型在说什么，并且能直接运行它。

🪄 道具二：WebAssembly（极速引擎）

比喻：通常浏览器跑复杂的数学题很慢，像蜗牛。但 WebAssembly 就像给浏览器装了一个F1 赛车引擎。
作用：它让 AI 模型在浏览器里跑起来飞快，几乎和直接在专业服务器上运行一样快。

🪄 道具三：自定义 SDK（智能管家）

比喻：你作为用户，输入的是“我 42 岁，去年得了流感”，这是人类语言。但 AI 需要的是"0, 1, 2"这种数字代码。
作用：这个 SDK 就像一个智能管家。它负责把你说的话翻译成 AI 能懂的数字（预处理），把 AI 算出来的数字结果再翻译回人类能看懂的“预测：50 岁可能有高血压风险”（后处理）。

4. 这个“魔法”带来了什么好处？

🔒 绝对隐私（数据不出门）：
这是最大的亮点。所有的计算都在你的设备上完成。你的健康数据从未离开过你的电脑，没有上传到任何服务器。就像你在家里写日记，只有你自己能看到。
🌍 随时随地可用（无需安装）：
你不需要下载几百兆的软件，也不需要安装复杂的程序。只要打开浏览器，点一下链接就能用。就像打开网页看新闻一样简单。
📚 遵循 FAIR 原则（特别是“可重用性”）：
论文提到他们遵循了 FAIR 原则（让数据更容易被找到、访问、互操作和重用）。通过把模型变成通用的格式，其他科学家或开发者可以很容易地拿这个模型去开发新的应用，而不需要重新发明轮子。

5. 现在的局限与未来

现状：目前这个“浏览器版 AI"是用模拟数据（假数据）训练的，所以它虽然跑得通，但预测的准确度还没达到顶级水平（就像用练习册做题，还没参加真正的考试）。
未来：作者计划未来用真实的百万级医疗数据来训练它，让它变得更聪明。甚至未来可能让 AI 在你本地学习（联邦学习），越用越懂你，但依然不泄露你的隐私。

总结

简单来说，这篇论文展示了一种**“把 AI 关进用户家里”**的新思路。

以前，我们为了用 AI，必须把隐私交给大公司；现在，通过ONNX 翻译和浏览器技术，我们可以把 AI 变成一种私人的、安全的、即开即用的工具。这就像是从“去公共图书馆查资料”变成了“把图书馆搬进自己家”，既安全又方便。

Each language version is independently generated for its own context, not a direct translation.

这是一份关于论文《Engineering FAIR Privacy-preserving Applications that Learn Histories of Disease》（工程化构建符合 FAIR 原则的隐私保护应用以学习疾病史）的详细技术总结。

1. 研究背景与问题 (Problem)

核心挑战：生成式 AI 模型（如 Delphi 2M）在预测个人疾病轨迹和发病风险方面具有巨大潜力，但其应用通常受限于数据隐私问题。传统架构要求将敏感的患者电子健康记录（EHR）上传至集中式的云端服务器进行处理，这引发了严重的监管合规和伦理担忧。
技术瓶颈：现有的模型部署主要依赖服务器端计算，缺乏在用户本地设备（如浏览器）上直接运行的能力，导致数据必须离开用户设备，无法满足严格的隐私治理要求。
FAIR 原则缺失：虽然原始模型文档完善，但在可重用性（Reusability）和互操作性（Interoperability）方面存在不足，难以让非技术用户在不上传数据的情况下直接访问推理功能。

2. 方法论 (Methodology)

该项目旨在将 Delphi 2M 模型从服务器端迁移到完全客户端（Client-side）的浏览器环境中运行，主要技术路径如下：

**模型转换与标准化 **(ONNX)：
- 利用 **Open Neural Network Exchange **(ONNX) 格式作为中间表示层。
- 将原始基于 PyTorch 框架训练的 Delphi 2M 模型（基于 nanoGPT 架构）导出为 ONNX 格式。
- 此举实现了模型与训练框架的解耦，使其能够被不同的运行时环境（如 JavaScript/WebAssembly）识别和执行。
**客户端推理引擎 **(WebAssembly & WebGPU)：
- 使用 ONNX Runtime Web，将 C++ 核心编译为 **WebAssembly **(Wasm)，以在浏览器中实现接近原生的计算速度。
- 利用 WebGPU 后端（在可用时）进行 GPU 加速，确保在资源受限的设备上也能高效运行。
自定义 JavaScript SDK：
- 开发了一个专用的 JavaScript SDK 来封装 ONNX Runtime Web API。
- 核心功能流程：
  1. 加载模型：在浏览器中加载 ONNX 文件并建立推理会话。
  2. 数据预处理：将用户输入的原始人类可读数据（如 ICD-10 代码、年龄）转换为模型所需的结构化数值张量（Tensors）。
  3. 迭代推理：执行 generateTrajectory 函数。模型输出 logits（概率），SDK 使用时间到事件采样方法（Time-to-event sampling）将 logits 转化为随机时间点 $t_{next}$ ，公式为 $t_{next} = -e^{\lambda} \cdot \ln(u)$ 。
  4. 轨迹生成：选择预测时间最短的事件作为下一步，更新患者年龄，循环此过程直到遇到“死亡”终止符或达到最大年龄（默认 85 岁）。
  5. 后处理：将输出张量转换回人类可读的疾病事件和年龄预测，并在前端展示。
应用部署：
- 构建了一个基于 ObservableHQ 的 Web 应用程序，用户无需下载或安装任何软件，即可在浏览器中直接输入健康轨迹并获取实时预测。

3. 关键贡献 (Key Contributions)

隐私优先的架构蓝图：成功证明了生成式 AI 模型可以在完全本地化的环境中运行，无需将敏感健康数据上传至云端，彻底消除了数据泄露风险。
FAIR 原则的工程化实践：
- **可重用性 **(Reusability)：通过 SDK 封装，使得复杂的推理流水线对开发者更加友好，易于集成。
- **互操作性 **(Interoperability)：利用 ONNX 标准，打破了 PyTorch 与 Web 技术栈之间的壁垒，实现了跨平台（从移动端到 GPU 加速桌面）的模型部署。
全客户端推理流水线：建立了一套从模型转换、SDK 开发到 Web 应用集成的完整工程流程，展示了“一次构建，随处运行”（Build once, run anywhere）的可行性。

4. 研究结果 (Results)

功能验证：成功开发并部署了一个名为 "Delphi App" 的 Web 应用（https://epiverse.github.io/delphiTrajectories），用户可输入 ICD-10 健康轨迹，系统即时在本地生成未来的疾病预测轨迹。
性能表现：模型在浏览器中运行流畅，利用 WebAssembly 和 WebGPU 实现了高效的推理速度，证明了在资源受限的客户端设备上运行大型生成式模型的可行性。
数据隔离：所有计算均在用户本地设备完成，网络层面仅传输模型文件（非敏感数据），实现了真正的隐私保护。
局限性：由于受限于原始论文提供的合成数据集（仅 7144 条轨迹，而非原始研究的 40 万条），当前原型模型的预测精度低于全量真实数据训练的模型，但这主要验证了工程架构而非临床性能。

5. 意义与展望 (Significance)

医疗 AI 治理的新范式：该研究为在医疗等敏感领域部署生成式 AI 提供了新的技术路径，即通过边缘计算（客户端推理）来解决数据主权和隐私合规问题，符合严格的数据治理标准。
技术示范效应：展示了 ONNX 作为通用运行时在连接传统 AI 研究与现代 Web 技术中的核心作用，为未来将更多科学模型转化为普惠的 Web 应用提供了参考。
未来方向：
- 计划利用真实世界的大规模数据集重新训练模型以提升临床效用。
- 探索客户端微调（Client-side fine-tuning）和联邦学习（Federated Learning），在保持数据本地化的前提下，通过用户反馈持续优化模型性能。

总结：这项工程工作不仅是一个技术演示，更是一个重要的概念验证（Proof-of-Concept），它表明通过标准化的模型格式（ONNX）和现代化的 Web 技术，可以在不牺牲隐私的前提下，让强大的生成式 AI 模型真正服务于个人健康管理。