Gaze2Report: Radiology Report Generation via Visual-Gaze Prompt Tuning of LLMs

Gaze2Report 是一个通过视觉 - 注视提示微调大语言模型来生成放射学报告的框架,它利用扫描路径预测模块和图神经网络在无需推理阶段真实眼动数据输入的情况下,模拟放射医生的视觉注意力以提升报告质量。

Aishik Konwer, Moinak Bhattacharya, Prateek Prasanna

发布于 2026-04-13
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 Gaze2Report(从目光到报告) 的新系统,它的目标是帮助电脑像经验丰富的放射科医生一样,看懂 X 光片并写出专业的诊断报告。

为了让你更容易理解,我们可以把整个过程想象成**“教一个聪明的学生(AI)如何像老专家一样看片子”**。

1. 现有的问题:学生只看了图,没看懂“重点”

以前的 AI 写报告,就像是一个刚毕业的学生拿着 X 光片。

  • 做法:它只是盯着图片看,试图描述上面有什么。
  • 缺点:它不知道医生在看哪里。医生看片子时,眼睛会先在心脏位置停留很久,然后扫过肺部,最后盯着肋骨看。这种**“视线停留”**(Eye Gaze)其实包含了医生认为哪里最重要、哪里可能有病的“潜台词”。
  • 结果:以前的 AI 虽然能写出通顺的句子,但经常抓不住重点,或者漏掉关键病情,就像学生只看到了“这里有块白影”,却写不出“这是肺炎引起的积液”。

2. 核心创新:Gaze2Report 的“三招”

为了解决这个问题,作者们设计了一套新系统,主要做了三件事:

第一招:给 AI 装上“透视眼” (视觉 + 目光融合)

  • 比喻:想象你在教学生看地图。以前的方法只给他看地图(图片);现在,我们不仅给他看地图,还给他看**“专家走过的路线”**(目光轨迹)。
  • 做法:系统利用一种叫图神经网络 (GNN) 的技术,把 X 光片切成很多小块,然后结合医生看这些块时的“停留时间”和“顺序”。
  • 效果:这就像告诉 AI:“嘿,别光看整体,医生在这里看了很久,说明这里有问题!”这让 AI 生成的报告更精准,更像真人医生写的。

第二招:让 AI 学会“边看边想” (大语言模型微调)

  • 比喻:以前 AI 是“看图说话”,现在它是**“带着任务去观察”**。
  • 做法:作者把“图片信息”、“目光信息”和“写作指令”(比如:“请写一份详细的诊断报告”)打包在一起,喂给一个超级聪明的语言模型(LLM,就像现在的 ChatGPT 级别的大模型)。
  • 效果:AI 不再只是机械地翻译图片,而是学会了像医生一样思考,把看到的异常和医学知识结合起来,写出逻辑严密、术语专业的报告。

第三招:解决“没有目光数据”的难题 (模拟视线)

  • 痛点:在现实医院里,医生看病时不会戴眼动仪,所以 AI 在真正工作时,是没有“专家视线”这个数据的。如果 AI 只靠训练时的数据,一上岗就“傻眼”了。
  • 比喻:这就像学生考试时,老师没在旁边盯着他看。怎么办?
  • 做法:作者给 AI 加了一个**“预测模块”。在训练时,AI 不仅学写报告,还学“预测医生会看哪里”**。
  • 效果:到了真正工作(推理)时,虽然没人盯着看,但 AI 能自己模拟出医生可能会关注的区域,然后基于这个模拟的视线去写报告。这就好比学生虽然没人盯着,但他脑子里已经记住了专家的观察习惯,自己就能找重点。

3. 实验结果:真的更好用吗?

作者在三个著名的医疗数据集上做了测试,结果很亮眼:

  • 写得更好:相比以前的方法,Gaze2Report 写出的报告在语言流畅度、专业术语的准确性上都有显著提升。
  • 更懂医学:在检查关键病情(如肺炎、心脏肥大等)的准确率上,它比那些只用图片的 AI 强很多,甚至接近或超过了那些专门针对特定疾病优化的模型。
  • 即使没有“目光”也能行:即使在没有真实眼动数据的情况下(靠模拟),它依然表现优异,证明了这套方法的实用性。

总结

Gaze2Report 就像是给 AI 请了一位**“影子导师”
它不仅让 AI 看 X 光片,还让 AI 学习医生
“怎么看”**(目光轨迹)。即使在实际工作中没有导师在旁边,AI 也能通过自己学到的“观察习惯”,写出既专业又准确的诊断报告。这大大减轻了放射科医生的工作负担,让诊断更快速、更可靠。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →