Think-Aloud Reshapes Automated Cognitive Model Discovery Beyond Behavior

本文表明,将出声思维轨迹纳入自动化认知模型发现过程,可显著提升预测性能,并使识别出的模型结构转向更整合的效用机制,从而揭示出仅凭行为数据无法还原的认知过程。

原作者: Hanbo Xie, Akshay K. Jagadish, Lan Pan, Robert C. Wilson

发布于 2026-05-07✓ Author reviewed
📖 1 分钟阅读☕ 轻松阅读

原作者: Hanbo Xie, Akshay K. Jagadish, Lan Pan, Robert C. Wilson

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

想象一下,你试图弄清楚一位朋友是如何决定晚餐吃什么的。你有两种了解他们决策过程的方法:

  1. “是什么”(行为): 你观察他们点餐。他们选了披萨。你看到了结果。
  2. “怎么做”(出声思维): 你让他们在决策时把想法说出来。他们说:“嗯,我饿了,但披萨太油腻了。也许我应该先查一下卡路里,然后再比较价格。”

长期以来,试图构建人类思维计算机模型的科学家们只能接触到“是什么”。他们观察人们做出的选择(例如选择冒险的赌博还是稳妥的选项),并试图逆向推导其背后的数学原理。

问题在于,“是什么”往往是一面模糊的镜子。许多不同的内部数学公式都能产生完全相同的最终选择。这就像看到一辆车在街上行驶;你知道它从 A 点移动到了 B 点,但你不知道司机是在使用 GPS、地图,还是仅仅在猜测。这使得计算机模型变得“欠定”——存在太多可能的答案,计算机可能会仅仅因为某个答案勉强符合数据而选错。

新方法:倾听内心独白

这篇论文介绍了一种构建这些模型的新方法。研究人员不再仅仅观察最终选择,而是将“怎么做”——即人们在决策时的实际口头思维(出声思维轨迹)——也输入给计算机模型。

他们利用一个超级智能的 AI(大型语言模型)充当侦探。AI 接收了两类线索:

  • 线索 A: 该人所做选择的列表。
  • 线索 B: 该人在做出这些选择时所说的话的转录文本。

随后,AI 尝试编写一个计算机程序,既能解释这些选择,也能解释那些口头思维。

他们的发现

研究人员在人们进行风险决策(例如在确定的小奖励和可能的大奖励之间做选择)时测试了这种方法。以下是当他们把“口头思维”加入其中时发生的情况:

1. 模型变得更聪明了(预测更准确)
当 AI 仅使用选择数据时,它能做出不错的猜测。但当它结合选择数据加上口头思维时,模型在预测此人下次会做什么方面变得准确得多。这就像侦探破案:如果你只看到脚印,可能会猜错嫌疑人。但如果你还能听到嫌疑人的不在场证明,你就能更准确地锁定真相。

2. 模型改变了它们的"DNA"(结构转变)
这是最令人惊讶的部分。AI 不仅仅是微调了数字;它彻底改变了用来解释人类思维的逻辑类型

  • 没有口头思维时: AI 主要认为人类使用的是**“拔河”**方法。它假设人们计算选项 A 的价值,计算选项 B 的价值,然后简单地比较这两个数字,看哪个更大。
  • 有了口头思维后: AI 意识到,对于大多数人(约 70%)来说,大脑的工作方式更像是一个**“搅拌机”**。人们并不是简单地比较两个独立的数字,而是先在每个选项内部混合各种成分(风险、奖励、概率),将它们融合成一种单一的感觉,然后再做出选择。

论文发现,对于近十分之七的人,加入口头思维迫使 AI 放弃了“拔河”模型,转而采用“搅拌机”模型。

核心启示

这篇论文的主要观点是:倾听人们如何思考,会改变我们绘制他们思维地图的方式。

如果你只看目的地(选择),你可能会画出一张看起来像直线的地图。但如果你倾听旅行者的评论,你就会意识到他们走了一条蜿蜒的小路,停下来欣赏风景,甚至可能还折返过。

通过加入“出声思维”数据,研究人员得到的不仅仅是一张稍微好一点的地图;他们发现地形本身与他们想象的不同。口头话语起到了约束作用,迫使计算机停止猜测,开始寻找人们实际使用的思维机制——如果你只观察他们的手,这些机制是看不见的。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →