fMRI-Based Prediction of Eye Gaze During Naturalistic Movie Viewing Reveals Eye-Movement-Related Brain Activity

该研究表明,尽管 DeepMReye 预训练模型在零样本设置下对个体眼动预测的准确性有限,但基于群体平均的 fMRI 眼动估计能有效捕捉共享的观看行为,并成功揭示与眼动控制相关的广泛脑区激活。

Gao, L., Wei, Z., Biswal, B. B., Di, X.

发布于 2026-04-12
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是在讲一个**“读心术”与“群体智慧”**的故事,只不过这里的“心”是我们在看电影时眼睛的动向,而“读心”的工具是核磁共振(fMRI)机器。

简单来说,科学家们想解决一个难题:很多以前的核磁共振扫描数据里,没有记录人们当时眼睛在看哪里(因为那时候还没普及眼动仪)。 如果不知道大家在看哪,就很难分析大脑是怎么处理视觉信息的。

于是,他们尝试用一种叫 DeepMReye 的超级人工智能(AI)模型,试图仅凭大脑扫描图像中眼球区域的信号,就“猜”出人们当时眼睛在看哪里。

以下是这篇论文的通俗解读:

1. 核心任务:给大脑扫描图“开天眼”

想象一下,你有一堆老电影(以前的核磁共振数据),但不知道观众当时盯着屏幕的哪个角落看。

  • 传统做法: 需要重新给每个人戴上眼动仪,但这在老数据里做不到,而且给小孩或病人戴眼动仪也很难。
  • 新方法: 作者直接拿出了一个**“预训练好的 AI 侦探”(DeepMReye 模型)。这个侦探以前在别的电影里学过怎么通过眼球信号猜视线,现在作者没有教它新东西(零样本设置)**,直接让它来猜新数据里的视线。

2. 实验结果:个人猜不准,但“群众”很聪明

这是论文最有趣的发现,可以用一个**“猜谜游戏”**来比喻:

  • 个人水平(猜谜高手 vs. 普通人):
    如果你让 AI 去猜某一个人当时在看哪里,它猜得不太准。就像让一个没经过专门训练的人去猜另一个人的心思,准确率只有 20%-30% 左右。有时候它猜偏了,有时候猜对了,波动很大。

    • 比喻: 就像让一个没戴过护目镜的人去猜别人在打乒乓球时球在哪,他只能瞎蒙。
  • 群体水平(众口一词):
    但是,如果你把所有人的猜测结果平均一下,奇迹发生了!AI 猜出的“群体视线”和真实的眼动仪记录惊人地一致(准确率高达 70%-80%)。

    • 比喻: 这就像“群体智慧”。虽然每个人猜得都有偏差,但当几百个人一起猜时,大家的错误互相抵消了,剩下的就是大家都盯着同一个地方看的那个“真相”。因为看电影时,大家通常会被精彩的画面吸引,视线是同步的。

3. 大脑地图:找到了“指挥眼睛的司令部”

既然群体视线猜得挺准,作者就用这个“群体视线”去分析大脑。

  • 发现: 当视线移动时,大脑里有一片区域特别活跃。
  • 位置: 这片区域包括额叶(前额)顶叶(头顶后方)
  • 比喻: 这就像是大脑里的**“交通指挥中心”**。当眼睛要转向新目标时,这个指挥中心就会亮起红灯,发出指令。以前我们不知道这些老数据里眼睛怎么动,现在通过 AI 还原视线,我们终于能在大脑地图上画出这个“指挥中心”在哪里了。

4. 年龄的魔法:孩子和大人的“看戏”方式不同

作者还研究了不同年龄的人(从 3 岁小孩到 39 岁大人)在看电影时,大脑和眼睛的配合有什么不同。

  • 发现: 这种配合不是简单的“越老越熟练”。
    • 有些脑区在青少年时期最活跃,到了成年反而下降了(像是一个倒 U 型曲线)。
    • 有些脑区随着年龄增长,视线同步性变好了(特别是垂直方向的视线,比如抬头低头看,大人比小孩更同步)。
  • 比喻: 就像学骑自行车。刚开始(小孩)摇摇晃晃,到了青少年时期(青春期)可能骑得最猛、最投入,但到了成年(稳重期),虽然骑得稳了,但那种“疯狂探索”的脑区活跃度反而降下来了。而且,大人看垂直方向的东西(比如抬头看飞机)比小孩更整齐划一。

5. 总结:这个技术有什么用?

  • 它的局限: 如果你想用它来精准监控某一个人的眼神(比如判断他是不是在走神,或者做临床诊断),现在的技术还不够准,就像现在的“群体智慧”不能直接用来猜“张三”具体在想什么。
  • 它的巨大价值: 如果你想研究一大群人在看电影时的共同反应,或者想挖掘那些没有眼动仪的老数据,这个技术简直是神器。它能把那些“死”的数据复活,告诉我们大家当时都在看哪里,以及大脑是怎么反应的。

一句话总结:
虽然 AI 单独猜一个人的眼神还有点“迷糊”,但只要把它放在一群人里,它就能通过“集思广益”精准还原大家看电影时的视线,帮我们重新发现大脑里那些控制眼睛的“指挥中心”,并揭示出从孩童到成人,我们“看世界”的方式是如何微妙变化的。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →