Ambient AI Documentation in Mixed-Language Encounters: A Heuristic Evaluation of Spanish-English and Mandarin-English Conversations

本研究评估了环境人工智能文档系统在混合语言临床场景中的表现,发现尽管整体转录错误率较低且语言切换通常能被可靠检测,但在中英文语码转换方面仍存在显著挑战,包括高错误异常值以及在切换点频繁出现的删除现象。

原作者: Hu, D., Flores, D., Flores, L., Chien, R., Lam, K., Chow, E., Guo, Y., Tam, S., Perret, D., Pandita, D., Zheng, K.

发布于 2026-05-22
📖 1 分钟阅读☕ 轻松阅读

原作者: Hu, D., Flores, D., Flores, L., Chien, R., Lam, K., Chow, E., Guo, Y., Tam, S., Perret, D., Pandita, D., Zheng, K.

原始论文采用 CC BY 4.0 许可(https://creativecommons.org/licenses/by/4.0/)。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

想象一种专为医生设计的全新“智能书记员”。这是一种环境人工智能工具,它能聆听医患之间的对话,逐字记录,并将对话转化为医疗记录。这就像拥有一位超级快速、不知疲倦且从不遗漏任何细节的秘书。

这篇论文提出了一个简单却至关重要的问题:当医生和患者同时使用两种语言交谈时会发生什么?

在现实世界中,许多患者和医生为了确保彼此理解,会在语言之间来回切换(例如英语和西班牙语,或英语和普通话)。这被称为“语码转换”。研究人员希望了解,这种 AI 书记员能否在不“绊倒自己”的情况下,应对这种“语言之舞”。

实验:一场排练好的戏剧

由于很难获得许可去录制真实的私人医患问诊,研究人员创作了一场“排练好的戏剧”。他们选取了 24 个真实的医疗场景,并让演员(实际上是研究人员和医学生)进行演绎。

  • 12 场西班牙语和英语对话。
  • 12 场普通话和英语对话。

他们将这些录音输入到 AI 工具(名为 Abridge)中,然后将 AI 生成的内容与“完美剧本”(参考转录稿)进行对比,以查看其错误数量。

成绩单:AI 表现如何?

1. 西班牙语 - 英语组合:流畅的舞者
当演员在西班牙语和英语之间切换时,AI 的表现相当不错。

  • 错误率:它犯的错误很少(平均约为 4%)。
  • 整体氛围:表现稳定。无论对话长短,AI 都能保持正轨。
  • 潜在问题:它偶尔会被发音相似的词语搞混(例如,因为混合发音相似,将“我的血压”听成“抑郁症”)。

2. 普通话 - 英语组合:绊脚石
当演员在普通话和英语之间切换时,AI 的挣扎更多。

  • 错误率:错误率较高(平均约为 9%),但真正的问题在于变异性。有些对话表现尚可,但其他对话则是一场灾难,错误率飙升至 67%。
  • 大幅缺失:最常见的错误不是词语互换,而是删除。想象一下,AI 在听一句话时,突然决定“我要跳过接下来的 50 个词”,从而在医疗记录中留下巨大的空白。这种情况在说话者从英语切换到普通话时频繁发生。
  • 困惑:AI 有时恰好在语言切换的那一刻迷失方向,导致整段对话内容丢失。

“故障”类型:AI 在哪里感到困惑

研究人员发现了 AI 出错的四种主要方式,并用一些有趣的类比来解释:

  • “听起来像”陷阱(语音相似性):
    AI 就像一个仅凭声音猜测单词而不看上下文的人。

    • 例子:在普通话中,一个表示“肝脏”的词听起来非常像表示“胆囊”的词,AI 将它们互换了。在西班牙语中,“我的压力”听起来像“抑郁症”,所以 AI 记录的是心理健康问题,而不是血压读数。
    • 跨语言混淆:英语单词"bone"(骨头)的发音与汉字“泵”完全相同。AI 听到了"bone",却写成了“泵”,从而制造了一份令人困惑的医疗记录。
  • “过度热情的翻译”(自动翻译):
    有时,AI 不仅仅是记录所说的内容;它试图即兴翻译,即使不应该这样做。

    • 例子:如果医生说了英语单词"chemotherapy"(化疗),AI 可能会写出其西班牙语单词("quimioterapia"),因为它认为语境需要西班牙语。
    • 拼音问题:有时,AI 没有写出汉字,而是写出了声音的英文字母版本(拼音),或者更糟的是,写出了毫无意义的“假拼音”。这就像试图用你只懂一半的语言来写食谱。
  • “医疗术语”盲区:
    AI 擅长日常词汇,但在复杂的医学术语上会绊倒,尤其是当这些术语带有口音或与其他语言混合时。

    • 例子:一种名为"Leqvio"的特定心脏药物被写成了"Lekvia"。一种名为"Zio"的贴片变成了"Xylem"。这就像一个知道“苹果”这个词但从未听说过“牛油果”的翻译,却猜成了“橙子”。
  • “语法故障”(语言特定问题):

    • 西班牙语:AI 有时会改变动词的时态(例如,将“我吸烟”改为“吸烟”),从而改变了患者病史的含义。
    • 普通话:AI 有时会混淆“他”、“她”和“它”,因为在普通话中它们的发音相同。它还在同一句话中随机切换简体和繁体汉字,就像一个无法决定使用哪种字母表的作家。

结论

该论文得出结论,虽然这位 AI 书记员令人印象深刻,但它尚未准备好应对完全的“多语言之舞”。

  • 它在西班牙语 - 英语对话中表现良好,仅有轻微的小插曲。
  • 它在普通话 - 英语对话中表现挣扎,经常丢失大段对话内容,或在语言切换的那一刻感到困惑。

为什么这很重要?
如果 AI 删除了一段对话或替换了一个医学术语,医生就必须花费额外时间阅读记录,寻找缺失的部分并修正错误。这违背了该工具的初衷,即旨在为医生节省时间并减少职业倦怠。

这项研究表明,为了让这些工具真正对所有人有所帮助,它们需要更好地处理两种语言碰撞时的“混乱中间地带”,确保没有任何患者的故事在翻译中丢失。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →