Brain-OF: An Omnifunctional Foundation Model for fMRI, EEG and MEG

本文提出了首个在 fMRI、EEG 和 MEG 三种模态上联合预训练的通用脑基础模型 Brain-OF,通过引入任意分辨率神经信号采样器、DINT 注意力与稀疏混合专家架构以及掩码时频建模目标,有效解决了多模态数据时空分辨率异质性问题,并在大规模数据集上展现了卓越的下游任务性能。

Hanning Guo, Farah Abdellatif, Hanwen Bi, Andrei Galbenus, Jon. N. Shah, Abigail Morrison, Jürgen Dammers

发布于 2026-03-03
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 Brain-OF 的超级大脑模型。为了让你轻松理解,我们可以把它想象成一位**“全能的脑科学超级侦探”**。

在此之前,科学家们研究大脑时,就像是用不同的“单眼眼镜”在观察:

  • fMRI(功能磁共振):像是一个高清广角相机。它能拍到大脑内部哪里在“发光”(空间分辨率高),知道具体是哪个房间(脑区)在干活,但它的照片是慢动作的,就像看延时摄影,看不清瞬间的动作。
  • EEG(脑电图)和 MEG(脑磁图):像是超高速摄像机。它们能捕捉到大脑里电流和磁场的瞬间变化(时间分辨率极高),知道大脑“下一秒”在做什么,但画面有点模糊,很难 pinpoint 具体是哪个房间在动(空间分辨率低)。

以前的困境:
以前的 AI 模型,要么只擅长看“慢动作高清图”(只懂 fMRI),要么只擅长看“瞬间模糊图”(只懂 EEG/MEG)。它们就像只会用一种眼镜的侦探,无法同时利用两种信息的优势,导致对大脑的理解不够全面。而且,因为每种数据都很稀缺,单独训练一个模型很难。

Brain-OF 的突破:
Brain-OF 是第一个**“三合一”的全能侦探**。它同时学习了 fMRI、EEG 和 MEG 三种数据。它的核心目标是:把“高清慢动作”和“瞬间模糊图”完美融合,既知道大脑哪里在动,又知道它什么时候动。

为了实现这个目标,作者设计了三个聪明的“绝招”:

1. 万能翻译官:Any-Resolution Neural Signal Sampler (ARNESS)

比喻: 想象 fMRI、EEG 和 MEG 是三个说着不同方言、语速不同、甚至用不同单位(比如一个用“米”,一个用“英寸”)的人。
作用: Brain-OF 里有一个“万能翻译官”。不管输入的数据是快是慢、是粗是细,它都能把大家强行拉到一个**统一的“语义空间”**里。它把杂乱无章的信号整理成整齐划一的“标准语言”,让后面的大脑模型能听懂所有人的话,而不需要为每种数据单独建一个部门。

2. 专家会诊团:Sparse Mixture of Experts (MoE) + DINT 注意力

比喻: 想象 Brain-OF 的核心是一个大型医院

  • 普通医生(共享专家):负责处理大家都有的共性知识(比如大脑的基本结构)。
  • 专科医生(路由专家):专门处理特定科室的难题(比如 EEG 的专科医生专门处理电信号,fMRI 的医生专门处理血流信号)。
  • DINT 注意力机制:大脑信号里有很多“噪音”(比如肌肉抖动、心跳干扰)。普通的 AI 容易“分心”,盯着噪音看。DINT 就像一位经验丰富的老中医,他能一眼看出哪些是“真脉象”(有意义的信号),哪些是“假象”(噪音),从而忽略干扰,专注于真正的病情。

这种设计避免了“顾此失彼”:以前训练模型时,如果 EEG 数据太多,模型就会变得只懂 EEG,忘了 fMRI。现在有了“专科医生”,大家各司其职,互不干扰,又能互相学习。

3. 双重透视眼:Masked Temporal-Frequency Modeling (MTFM)

比喻: 以前训练 AI 时,通常是把一段视频遮住一部分,让它猜被遮住的部分(就像玩“看图猜词”)。但这通常只看“时间”维度。
作用: Brain-OF 玩的是**“双重猜谜”。它不仅让你猜“时间”上被遮住的部分(下一秒发生了什么),还让你猜“频率”上被遮住的部分(这个动作的音调/节奏是什么)。
这就好比教学生学音乐,不仅要让他记住旋律(时间),还要让他理解和弦的构成(频率)。通过这种
“时空双重建构”**,模型被迫去理解大脑信号背后更深层的物理规律,从而变得更聪明。

成果如何?

  • 数据量巨大:作者收集了全球 40 多个公开数据集,涵盖了 3 万多名参与者,近 600 万个样本。
  • 表现超强:在测试中,Brain-OF 在识别癫痫、诊断阿尔茨海默病(老年痴呆)、预测脑年龄、识别情绪等任务上,都打败了以前那些“单科专家”模型。
  • 举一反三:最厉害的是,它不仅能处理单一数据,还能把 fMRI 和 EEG 结合起来(比如用 fMRI 的空间定位能力去修正 EEG 的模糊定位),实现了"1+1>2"的效果。

总结

Brain-OF 就像是一位博学的“大脑全才”。它不再偏科,而是通过独特的架构,将不同视角的脑科学数据完美融合。它不仅看得更清(空间),也看得更快(时间),还能在嘈杂的环境中抓住重点。

这对我们意味着什么?
这意味着未来医生可以用更便宜、更便携的设备(如 EEG 头环)结合 AI 的大模型知识,做出原本只有昂贵核磁共振(fMRI)才能做出的精准诊断。它让高精尖的脑科学研究变得更普及、更快速,有望帮助更多癫痫、抑郁症和老年痴呆患者。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →