BAH Dataset for Ambivalence/Hesitancy Recognition in Videos for Digital Behavioural Change

本文介绍了首个用于识别数字健康行为改变中矛盾与犹豫(A/H)的多模态视频数据集 BAH,该数据集包含 300 名参与者的 1427 段视频及专家标注,并提供了基准测试结果以突显当前模型在该任务上的局限性及未来改进方向。

Manuela González-González, Soufiane Belharbi, Muhammad Osama Zeeshan, Masoumeh Sharafi, Muhammad Haseeb Aslam, Marco Pedersoli, Alessandro Lameiras Koerich, Simon L Bacon, Eric Granger

发布于 2026-03-05
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一项名为 BAH 的新研究,它就像是为人工智能(AI)准备的一本“犹豫不决与内心纠结”的行为字典

想象一下,你正在和一个朋友聊天,劝他戒烟或开始健身。有时候,朋友嘴上说“好,我明天就开始”,但眼神却飘忽不定,身体往后缩,声音里带着一丝犹豫。这种**“心里想变好,但又有点不想动”的矛盾状态,就是论文里说的“矛盾与犹豫”(Ambivalence/Hesitancy, A/H)**。

在现实生活中,医生或心理咨询师能敏锐地捕捉到这些细微的信号。但在数字健康(比如手机 App、在线教练)的世界里,AI 往往是个“直男”,它只能听懂你说了什么,却看不懂你眼神里的挣扎,也听不出你声音里的迟疑。这就导致很多在线健康项目效果不好,因为 AI 无法像真人一样“察言观色”。

为了解决这个问题,作者们做了一件大事:

1. 他们造了一个“纠结博物馆”(BAH 数据集)

作者们找来了 300 位加拿大普通人,让他们对着电脑摄像头回答 7 个精心设计的问题。

  • 怎么问的? 比如:“告诉我一件你很喜欢做但希望停止的事(比如吃甜食)”或者“一件你还没做但应该做的事(比如去体检)”。
  • 发生了什么? 在回答这些问题时,人们会自然地流露出犹豫、纠结、想改又改不了的状态。
  • 规模有多大? 他们收集了 1427 段视频,总时长超过 10 个小时。这就像是一个巨大的“纠结行为图书馆”。

2. 给 AI 请了三位“超级导师”(人工标注)

光有视频还不够,AI 需要有人教它什么是“犹豫”。

  • 作者请了 3 位行为科学专家,像看电影一样,一帧一帧地分析这些视频。
  • 他们不仅标记出“犹豫”发生的时间点(比如第 5 秒到第 9 秒),还记录了线索
    • 脸上:眼神躲闪、皱眉。
    • 身体:坐立不安、耸肩。
    • 声音:说话停顿、叹气。
    • 语言:嘴里说着“我想”,但马上又加个“但是……"。
  • 这就好比给 AI 配了一本**“微表情与微动作解码手册”**,告诉它:“看,当一个人一边点头一边摇头,或者一边说‘好’一边叹气时,这就是犹豫!”

3. 让 AI 去“考试”(基准测试)

有了这本“字典”和“手册”,作者们让现有的 AI 模型去尝试识别这些犹豫。

  • 结果如何? 就像让一个刚毕业的学生去考高难度的心理学博士,AI 的表现并不完美
  • 为什么难? 因为“犹豫”太微妙了。它不是简单的“开心”或“难过”,而是一种内心的冲突
    • 有时候,嘴上说的脸上演的是打架的(比如嘴上说“没问题”,脸上却写着“我很痛苦”)。
    • 有时候,同一模态里也有冲突(比如声音在颤抖,但身体却在僵硬)。
  • 目前的 AI 模型大多擅长识别“大笑”或“大哭”,但面对这种**“又爱又恨”、“想进又想退”**的复杂情绪,它们还显得有点笨手笨脚。

4. 未来的方向:给 AI 装上“读心术”

这篇论文的核心贡献不仅仅是给了大家一个数据集,更是指出了问题

  • 我们需要更聪明的 AI,它不能只看脸,也不能只听声音,必须同时看、听、读,并且能发现它们之间的矛盾
  • 未来的 AI 应该像一个经验丰富的老中医,能通过“望闻问切”的综合判断,精准地识别出用户是不是在“假装配合”,从而及时调整策略,给出更贴心的建议。

总结

简单来说,这篇论文就是给 AI 界送了一份珍贵的“犹豫行为大礼包”
以前,AI 在数字健康领域是个“瞎子”,看不懂人的内心挣扎;现在,有了这个数据集,AI 终于有了学习如何理解人类“纠结”情绪的机会。虽然现在的 AI 还像个刚学走路的孩子,但这块“垫脚石”将帮助未来的数字健康助手变得更有人情味,真正懂得何时该鼓励,何时该停下来倾听。

这就好比: 以前你的健身教练(AI)只会机械地喊“加油”;有了这个数据集后,未来的教练能发现你虽然嘴上答应,但眼神里全是“不想动”,于是它会温柔地说:“看来今天状态不好,我们换个轻松点的计划吧?”这才是真正的个性化关怀