AI-Generated Responses to Patient's Messages: Effectiveness, Feasibility and Implementation

⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这是一篇关于医院尝试使用"AI 助手”来帮医生回复患者消息的研究论文。

为了让你更容易理解，我们可以把这篇研究想象成一家繁忙的餐厅，医生是厨师，患者发来的消息是点餐单，而那个 AI 工具（叫"Art"）就是新来的智能点餐机器人。

以下是用通俗语言和比喻对这项研究的解读：

现状：自从疫情后，患者给医生发信息（点餐单）的数量暴增。医生（厨师）不仅要看病，还要花大量时间回复这些消息，累得够呛，甚至想“辞职”（职业倦怠）。
新工具：医院引进了一款名为"Art"的 AI 工具。它的作用就像是一个智能机器人，能根据病人的病历（厨房里的库存记录），自动草拟一封回复信给病人。
目标：医生只需要看一眼机器人写的草稿，觉得行就发出去，不行就改改。希望能帮医生省时间，少加班。

谁参与了：荷兰一家大医院的四个科室（皮肤科、肺科、肿瘤科、耳鼻喉科）的医生、护士和行政人员。
怎么做的：
- 先问大家：“你们觉得这机器人能帮上忙吗？”（期望值）。
- 然后让大家用半年，看看实际效果。
- 最后再问：“你们现在觉得它好用吗？省时间了吗？”（实际体验）。

这就好比大家刚看到新机器人时，觉得它是个超级英雄，结果用了一段时间发现，它更像是一个还需要人盯着的实习生。

省时间了吗？
- 没有明显感觉。数据显示，医生用机器人写草稿和不用机器人自己写，花的时间差不多。
- 原因：因为机器人写的草稿经常有错，或者不够准确。医生必须像校对员一样，花大量时间去检查、修改，甚至重写。这反而抵消了它带来的便利。
大家喜欢用吗？
- 一开始很火，后来凉了。刚开始有 27% 的人用，后来降到只有 16% 左右。很多人觉得“算了，还是我自己写比较快、比较放心”。
大家觉得它怎么样？
- 写得不错，但不够“懂行”。大家夸它句子通顺、语气礼貌（像机器人学会了客套话）。
- 但是，它经常犯医学错误（比如把药名搞错，或者建议病人下次复诊，其实病人现在就需要吃药）。这种错误让医生很紧张，生怕出医疗事故。
- 缺乏人情味：有些回复太像机器生成的，不够温暖，医生担心病人会觉得被冷落了。

研究发现了几个关键障碍：

这项研究告诉我们，虽然 AI 很有潜力，但目前它还不能完全替代医生去回复病人。

就像学开车：现在的 AI 就像一辆辅助驾驶系统，它能帮你稳住方向盘（生成草稿），但你（医生）必须时刻把手放在方向盘上，盯着路况（检查内容），随时准备接管。
未来的建议：
- 别吹牛：要诚实地告诉大家，AI 只是个助手，不是神医。
- 多沟通：医生和开发 AI 的人要多交流，告诉 AI 哪里写错了，让它慢慢变聪明（就像教实习生一样）。
- 定标准：得先定好规矩，AI 的准确率要达到多少分，才能正式上岗。

一句话总结：
医院请了个 AI 来帮医生回消息，大家本来以为能“躺平”省时间，结果发现还得花精力去“挑错”和“润色”。虽然它是个不错的草稿生成器，但目前还只是个需要严格监管的实习生，离成为“得力干将”还有很长的路要走。

类似论文