OSF: On Pre-training and Scaling of Sleep Foundation Models

该论文通过构建包含 16.65 万小时睡眠数据的大规模基准 SleepBench,系统揭示了睡眠基础模型预训练与扩展的关键规律,并据此提出了在跨设备泛化性及多任务预测性能上均达到最先进水平的 OSF 模型家族。

Zitao Shuai, Zongzhe Xu, David Yang, Wei Wang, Yuzhe Yang

发布于 2026-03-03
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是在给睡眠研究界开了一场“超级大厨”的研讨会。

想象一下,睡眠数据(PSG)就像是食材。以前,医生和科学家想分析一个人的睡眠质量或预测疾病,必须依赖非常昂贵、复杂的设备(像全套的厨房),在实验室里整夜监测大脑、心脏、呼吸等十几个信号。

但问题在于:

  1. 食材不统一:有的家庭监测设备只有“呼吸”和“心跳”,没有“大脑”信号;有的设备信号会断断续续(就像做饭时突然少了一味调料)。
  2. 以前的“厨师”太挑剔:现有的 AI 模型(以前的厨师)习惯了在实验室那种“全套食材”下做饭。一旦到了家里,发现少了一味“大脑”的调料,它们就彻底不会做了,做出来的菜(诊断结果)很难吃。

这篇论文的作者们(来自 UCLA 和 Emory 大学)决定做三件事来改变现状:

1. 建立了一个巨大的“公共食材库” (SleepBench)

他们收集了来自 9 个不同来源的16.6 万小时的睡眠录音。

  • 比喻:这就像他们建了一个巨大的“中央厨房”,里面不仅有顶级餐厅的食材,也有普通家庭、不同地区、不同设备的食材。他们把这些杂乱无章的食材清洗、切好,整理成标准的“30 秒小份”,准备用来训练 AI。

2. 发现了三个“烹饪秘诀” (核心发现)

在训练 AI 的过程中,他们发现了以前被忽略的三个关键点:

  • 秘诀一:不能太依赖“大脑”这道主菜

    • 现象:以前的 AI 模型如果突然拿不到“大脑信号”(比如在家用简易设备),表现就会暴跌。
    • 比喻:就像以前的厨师只会做“红烧肉”,一旦没有猪肉,他就不会做菜了。但现实是,有时候我们只有“鸡肉”或“鱼肉”。
    • 结论:AI 必须学会“随机应变”,即使缺了某些信号,也能利用剩下的信号做出好菜。
  • 秘诀二:要教 AI“举一反三” (通道不变性)

    • 做法:他们在训练时,故意把某些信号“遮住”(比如随机把心跳信号盖住,或者把呼吸信号盖住),强迫 AI 学会:“哦,虽然我看不到心跳,但我看呼吸也能猜出睡眠状态。”
    • 比喻:这就像教学生做题时,故意把题目里的关键数字擦掉,逼学生学会用其他线索推导答案。这样学生(AI)以后遇到任何残缺的题目都能做对。
  • 秘诀三:食材越多、锅越大,菜越香 (Scaling Laws)

    • 做法:他们发现,只要给 AI 喂更多的数据(更多小时的录音),用更大的模型(更大的锅),并且混合不同来源的食材,AI 就会变得越来越强。
    • 比喻:以前大家觉得 AI 吃到一定程度就“饱了”(性能不再提升),但他们发现,只要训练方法对(用了上面的“遮住信号”法),AI 就像个无底洞,吃得越多,越聪明。

3. 推出了新厨师:OSF (Open Sleep Foundation Model)

基于以上发现,他们训练出了一个新的 AI 模型家族,叫 OSF

  • OSF 有多强?
    • 全能选手:无论是在实验室(全套设备)还是在家里(只有呼吸和心跳),它都能精准判断睡眠阶段(是深睡、浅睡还是做梦)。
    • 预测疾病:它不仅能看睡眠,还能通过睡眠数据预测一个人有没有高血压、糖尿病或心脏病
    • 少样本学习:如果只给它看很少的标注数据(比如只给 1 个例子),它也能很快学会新任务,不像以前的模型那样需要大量数据才能“开窍”。

总结

这篇论文的核心思想就是:不要只教 AI 在完美的实验室里做实验,要教它在充满不确定性的现实世界中生存。

他们通过大规模的数据故意制造困难(遮挡信号)的训练方法,以及不断放大模型规模,打造了一个更聪明、更鲁棒、更通用的睡眠 AI。现在,这个 AI 已经开源了,意味着未来的睡眠监测设备(哪怕是简单的家用手环)可能会因为它的存在,变得像医生一样专业。

一句话概括:他们给 AI 厨师上了一堂“野外生存课”,让它学会了在缺斤少两的厨房里,依然能做出米其林级别的健康诊断大餐。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →