Population differences in wearable device wear time: Rescuing data to address biases and advance health equity

该研究利用"All of Us"项目中的 Fitbit 数据,首次系统揭示了人口学、社会经济及心理健康等因素对可穿戴设备佩戴时长的显著影响,指出传统合规阈值会加剧疾病人群的数据偏差,并据此提出了一套包含动态阈值与统计校正在内的灵活框架,以优化数据保留并推动数字健康研究的公平性。

Hurwitz, E., Connelly, E., Sklerov, M., Master, H., Hochheiser, H., Butzin-Dozier, Z., Dunn, J., Haendel, M. A.

发布于 2026-03-06
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是在给可穿戴设备(比如 Fitbit 智能手表)做了一次“体检”,发现了一个以前被大家忽略的大问题:不同人群戴手表的“勤快程度”不一样,而如果我们不处理好这个问题,就会在健康研究中产生巨大的偏见。

为了让你更容易理解,我们可以把这项研究想象成**“一场关于谁在认真跑步的马拉松”**。

1. 核心问题:为什么有些人“退赛”了?

想象一下,研究人员组织了一场马拉松(健康研究),让所有人戴上智能手表来记录跑步数据。

  • 传统的做法(旧规则): 研究人员规定:“如果你今天跑步时间少于 10 小时,你的数据就作废,直接扔掉,不算数。”
  • 发现的问题: 研究人员发现,那些生病的人(比如抑郁症患者)、收入较低的人、或者女性,往往因为身体不舒服、太忙或者没动力,手表戴得没那么久。
  • 后果: 如果直接按“少于 10 小时就扔掉”的旧规则,生病的人的数据会被大量丢弃(就像把那些因为生病跑不动的选手直接踢出比赛),而健康人的数据保留得很多。
    • 比喻: 这就像是在研究“为什么大家跑得慢”,结果你把所有跑得慢的人都赶出赛场了,最后得出的结论是“大家都跑得很快”,这显然是错的,而且对生病的人不公平。

2. 研究发现:谁戴得久?谁戴得短?

研究人员分析了近 1.2 万名“跑者”(All of Us 项目参与者)的数据,发现了一些有趣的规律:

  • 戴得久的人(“勤奋组”): 男性、年纪大一点的人(60-70 岁)、收入高、学历高、有保险的人。他们更有可能把手表戴满一整天。
  • 戴得短的人(“困难组”): 女性、年轻人、收入低、学历低、没有保险的人。
  • 最明显的差异(“生病组”):抑郁症、焦虑症的人,或者被确诊患有这些疾病的人,他们戴手表的时间显著变短。
    • 比喻: 这就像是一个人生病了,连起床都困难,更别提坚持戴手表记录数据了。这时候,“戴得短”本身就是一个重要的健康信号,而不是无效数据。

3. 最惊人的数据:旧规则有多“狠”?

研究做了一个对比:

  • 对于健康人,如果按“每天戴满 10 小时”的标准,大概只有 21% 的天数被扔掉。
  • 对于抑郁症患者,同样的标准下,竟然有 74.4% 的天数被扔掉了!
  • 比喻: 这就像是在筛选“谁更努力”,结果把 3/4 的生病选手的数据都删光了,只留下了那些本来就很健康、很努力的选手。这样做出来的研究,完全无法代表真实世界,也帮不到那些最需要帮助的人。

4. 解决方案:如何“抢救”这些数据?

作者提出了一套新的“比赛规则”,不再简单粗暴地扔掉数据,而是用更聪明的方法:

  • 方法 A:把“戴表时间”当作一个变量(协变量调整)。
    • 比喻: 就像在计算跑步成绩时,不仅看跑了多远,还考虑到“你今天只穿了半天的鞋”。我们在分析时,把“戴了多久”这个因素算进去,而不是直接删掉没戴够时间的人。这样就能保留所有数据,同时修正偏差。
  • 方法 B:算“速度”而不是“总里程”(指标归一化)。
    • 比喻: 如果一个人只戴了 2 小时,走了 2000 步;另一个人戴了 10 小时,走了 10000 步。与其比总数,不如比“每小时走多少步”。这样即使戴的时间短,也能公平地比较谁更活跃。
  • 方法 C:降低门槛(自适应阈值)。
    • 比喻: 既然生病的人很难戴满 10 小时,那我们就把标准降到 6 小时或 8 小时,只要数据质量够好就行,尽量多保留一点数据。

5. 总结:为什么要关心这个?

这项研究告诉我们,可穿戴设备不仅是收集数据的工具,手表“戴没戴”这件事本身,就藏着关于健康状况的重要线索。

  • 对科学界: 以后做研究,不能只盯着“健康人”的数据,要用更灵活的方法(比如上面的 A、B、C 方法)来保留生病人群的数据,否则研究结果会有偏差,甚至误导医生。
  • 对社会公平: 如果一直用旧规则,低收入、生病、少数族裔群体的声音会被“静音”,医疗进步的红利他们就拿不到。新的方法能让这些“沉默的数据”重新发声,推动更公平的健康研究。

一句话总结:
以前我们因为有人“偷懒”没戴够时间就扔掉数据,结果把生病的人排除在外了;现在我们要学会**“理解他们的难处,用更聪明的数学方法把他们的数据留下来”**,这样我们的健康研究才能真正帮助到每一个人。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →