Automated Measurement of Geniohyoid Muscle Thickness During Speech Using Deep Learning and Ultrasound

本文提出了一种名为 SMMA 的深度学习自动化框架,通过结合分割与骨架化技术实现了对言语过程中舌骨下肌群(geniohyoid)厚度的精准测量,不仅达到了接近人工标注的准确度,还揭示了粤语元音发音中的肌肉激活模式及性别差异,为大规模言语运动控制研究及吞咽障碍评估提供了可扩展的客观工具。

Alisher Myrgyyassov, Bruce Xiao Wang, Yu Sun, Shuming Huang, Zhen Song, Min Ney Wong, Yongping Zheng

发布于 2026-03-05
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一项非常酷的技术,就像给说话时的舌头肌肉装上了一个"全自动智能尺子"。

为了让你更容易理解,我们可以把这项研究想象成是在解决一个"数豆子"的难题。

1. 为什么要做这个?(原来的麻烦事)

想象一下,医生或科学家想研究我们说话时,舌头下面那块叫“颏舌骨肌”(Geniohyoid,简称 GH)的肌肉是怎么动的。这块肌肉就像舌头的“升降梯”,负责控制下巴的升降和舌头的形状。

以前,要测量这块肌肉,科学家得拿着超声波(就像给身体拍 X 光,但没辐射)拍视频,然后人工在屏幕上画圈圈,把肌肉的轮廓描出来,再拿尺子量厚度。

  • 痛点:这就像让一个人在一小时的视频里,一帧一帧地手动画圈圈。这太累了!而且每个人画的圈可能都不一样(有的画大点,有的画小点),导致数据不准,根本没法做大规模的研究。

2. 他们做了什么?(SMMA 系统)

为了解决这个问题,作者们开发了一个叫 SMMA 的自动系统。你可以把它想象成一个"超级 AI 摄影师 + 智能测量员"的组合:

  • 第一步:AI 找肌肉(像玩“找不同”游戏)
    系统里有一个经过特殊训练的 AI(叫 UltraUNet)。它看过成千上万张超声波图片,学会了像侦探一样,自动在杂乱的图像中把那块肌肉“圈”出来。

    • 比喻:以前是人拿着放大镜在沙滩上找贝壳,现在是一个机器人,一眼就能把贝壳从沙子里挑出来,而且挑得比人还准(准确率高达 90% 以上,几乎和人类专家一样)。
  • 第二步:骨架测量(像给肌肉量腰围)
    一旦 AI 圈出了肌肉,系统就会在肌肉中间画一条细细的“中线”(骨架)。然后,它像用游标卡尺一样,垂直测量这条中线到肌肉边缘的距离,算出肌肉的厚度。

    • 比喻:这就像给肌肉量“腰围”,而且是一秒钟量几百次,完全不需要人手去碰。

3. 他们发现了什么?(有趣的发现)

他们用这个新工具测试了 11 个说粤语的人,让他们发三个音:/a:/(啊)、/i:/(衣)、/u:/(乌)。结果发现了一些非常有意思的规律:

  • 发“啊”音时,肌肉最“壮”
    当人们发低元音 /a:/(嘴巴张得很大)时,这块肌肉变得很厚(平均 7.29 毫米)。
    • 为什么?就像你用力把下巴往下拉时,脖子下面的肌肉会绷紧变厚一样。发“啊”音需要把下巴降得很低,所以肌肉得用力收缩。
  • 发“衣”音时,肌肉变“瘦”
    当发高元音 /i:/(嘴巴咧开,下巴抬高)时,肌肉变薄了(平均 5.95 毫米)。
    • 为什么?这时候下巴是抬起来的,这块肌肉不需要那么用力,所以它就“放松”变薄了。
  • 男女有别
    男性的肌肉普遍比女性厚一点点(5-8%),这就像男生通常骨架大一点,肌肉也自然大一点,属于正常的生理差异。

4. 这有什么用?(未来的意义)

这项技术就像给语言学和医学研究装上了"涡轮增压":

  1. 不再需要人工画圈:以前一天只能测几个人,现在 AI 可以一天测成千上万个人,让大规模研究成为可能。
  2. 诊断说话障碍:对于有构音障碍(说话不清楚)或吞咽困难的人,医生可以用这个工具客观地看到他们的肌肉是不是“没力气”或者“动错了地方”,就像给肌肉做体检。
  3. 康复监测:可以精确地跟踪病人康复过程中,肌肉力量有没有恢复。

总结

简单来说,这篇论文就是发明了一个全自动的“肌肉厚度测量仪”。它用 AI 代替了人类辛苦的手工测量,不仅测得准、测得快,还帮我们揭开了说话时舌头肌肉运动的秘密。这就像是从“手工缝制衣服”进化到了“全自动智能裁缝”,让未来的语言研究和医疗诊断变得更加精准和高效。