Not All Trust is the Same: Effects of Decision Workflow and Explanations in Human-AI Decision Making

Each language version is independently generated for its own context, not a direct translation.

这篇论文探讨了一个我们日常生活中越来越常见的问题：当我们让 AI 帮我们做决定时，我们该如何“信任”它？

想象一下，你正在玩一个游戏，AI 是你的“副驾驶”。有时候 AI 很准，有时候它会胡说八道（比如幻觉）。我们的目标是找到一种“刚刚好”的信任：AI 对的时候听它的，AI 错的时候我们要能识破它。

这篇研究就像是一场**“信任实验室”**，科学家们设计了不同的游戏规则，看看哪种方式能让我们既不盲目迷信 AI，也不顽固地拒绝好建议。

以下是这篇论文的通俗解读：

1. 核心实验：两种“副驾驶”模式

研究者把参与者分成两组，让他们在一个模拟的“大学学生支持办公室”里做决定（比如判断某个学生会不会退学）。他们使用了两种不同的工作流程：

模式 A（一步到位）： 你刚看到学生资料，AI 马上就把它的建议（“会毕业”或“会退学”）和理由甩在你脸上。你直接看，然后做决定。
- 比喻： 就像你刚想出门，朋友立刻说：“别去，外面下雨！”你直接听他的。
模式 B（两步走）： 你看到资料后，必须先自己先做一个决定，提交之后，AI 才跳出来说：“嘿，我觉得应该是……"然后你可以选择坚持自己的，或者改听 AI 的。
- 比喻： 就像你先自己查了天气预报，心里有了底，然后朋友才说：“我觉得要下雨。”这时候你再决定要不要改主意。

研究者的初衷： 以前有人觉得“模式 B"更好，因为它强迫你先思考，防止你太依赖 AI（也就是防止“过度信任”）。

2. 实验发现：意想不到的反转

发现一：嘴上说的 vs. 实际做的（信任与依赖是两码事）

研究者发现，“我觉得我信任 AI"（口头报告）和“我实际上听了 AI 的话”（行为依赖）之间，关系很弱。

比喻： 这就像一个人嘴上说“我特别相信我的导航仪”，但每次遇到路口他还是习惯性地自己看路标。或者反过来，他嘴上说“我不信这破导航”，但每次还是乖乖跟着导航走。
结论： 别光问用户“你信任 AI 吗？”，要看他们实际上有没有听 AI 的。这两者不能混为一谈。

发现二：“两步走”并没有让人更清醒，反而让人更盲从！

这是最让人惊讶的结果。研究者原本以为“模式 B"（先自己思考，再看 AI）能让人更独立，结果发现：

在“模式 B"下，人们反而更容易盲目听从错误的 AI 建议（过度依赖）。
比喻： 想象一下，你先自己费力地想了一个答案，然后 AI 跳出来给了个答案。这时候，你反而觉得：“既然我都想这么久了，AI 又这么自信，那肯定是 AI 对，我刚才想错了。”于是你更容易被 AI 带偏，哪怕 AI 是错的。
结论： 强迫你先思考，并没有减少盲从，反而可能让你更想“修正”自己的直觉去迎合 AI。

发现三：解释（理由）是个“双刃剑”，取决于流程

AI 如果给出理由（比如“因为该生挂科多”），效果如何？

在**“模式 A"（一步到位）中，给理由反而让人的信任度稍微下降**了一点点。
在**“模式 B"（两步走）中，给理由却让人的信任度大幅上升**。
比喻： 这就像厨师做菜。如果你先尝了一口（模式 B），厨师再解释“我加了点秘制香料”，你会觉得“哇，这解释太合理了，真好吃”；但如果你还没尝，厨师就在那喋喋不休解释香料，你可能会觉得“太啰嗦了，甚至怀疑是不是为了掩盖味道不好”。
结论： 同样的“解释”，在不同的流程下，效果完全相反。不能一概而论。

发现四：懂行的人 vs. 外行

懂行的人（有领域知识）： 在“模式 B"中，他们更信任 AI，因为 AI 的解释验证了他们的想法。
外行（不懂领域）： 他们不管在哪种模式下，信任度都差不多，或者稍微低一点，但他们的行为（听不听 AI）并没有因为懂不懂行而有太大区别。

3. 这对我们设计 AI 有什么启示？

这篇论文给开发者和设计师敲了警钟：

别搞“一刀切”： 没有一种万能的工作流程（比如“先自己思考再看 AI"）能解决所有问题。有时候它反而让人更盲目。
别只问“你信不信”： 要设计实验去观察用户实际上是怎么做的（比如他们改不改主意），而不仅仅是发问卷问他们“你信任吗”。
流程决定解释的效果： 如果你想加 AI 解释，得先想好你的流程是“一步”还是“两步”。在错误的流程里加解释，可能适得其反。
灵活应变： 也许最好的办法不是强迫用户先思考，而是根据情况灵活调整。比如，当 AI 自己都不太确定时，再让用户先思考；或者让用户自己选择要不要看解释。

总结

这就好比**“信任”不是一种单一的情绪，而是一套复杂的舞蹈**。

如果你只是问舞者“你信任音乐吗？”，答案可能不准。
如果你强迫舞者先跳一段（两步走），他们可能反而更容易踩错拍子（过度依赖 AI）。
如果你给舞者看乐谱（解释），在有些节奏下是神助攻，在有些节奏下就是干扰。

核心建议： 在设计 AI 助手时，不要试图用一个固定的规则（比如“先想后看”）来管理所有人的信任。要像指挥家一样，根据乐曲（任务）和乐手（用户）的特点，灵活调整互动的节奏。

Each language version is independently generated for its own context, not a direct translation.

这是一份关于论文《Not All Trust is the Same: Effects of Decision Workflow and Explanations in Human-AI Decision Making》（并非所有信任都相同：决策工作流与解释在人类-AI 决策中的影响）的详细技术总结。

1. 研究问题 (Problem)

在 AI 辅助决策（AI-assisted decision making）中，核心挑战在于实现有保证的、校准良好的信任（warranted, well-calibrated trust）。

过度信任（Overtrust/Overreliance）： 用户盲目接受 AI 的错误建议。
信任不足（Undertrust）： 用户拒绝正确的 AI 建议。
现有研究的局限性：
- 决策工作流差异： 之前的研究未统一决策流程设计。有的采用单步设置（1-step），即直接展示 AI 建议；有的采用双步设置（2-step），即要求用户先做出初步决定，再查看 AI 建议。
- 信任测量差异： 研究多依赖自我报告的信任（Self-reported trust）（问卷调查）或行为信任（Behavioral trust/Reliance）（实际采纳率），但两者之间的关系尚不明确。
- 解释（Explanations）的作用不明： 解释是否能有效校准信任，以及其与决策工作流（1-step vs 2-step）之间是否存在交互效应，目前结论不一。

2. 方法论 (Methodology)

实验设计：

类型： 在线受试者间实验（Between-subjects online study）。
样本量： $N = 300$ 。
设计架构： $2 \times 2$ 因子设计。
- 自变量 1：决策工作流
  - 1-step： 直接展示 AI 预测结果。
  - 2-step： 用户先提交自己的初步决策，然后展示 AI 预测结果（允许用户修改）。
- 自变量 2：解释（Explanations）
  - 有解释： 展示基于规则生成的局部特征重要性解释（Local feature importance），高亮显示支持预测的三个关键特征。
  - 无解释： 仅展示预测结果。
- 协变量： 用户的领域知识（Domain Knowledge）和 prior AI 经验。
任务场景： 虚构的大学学生支持办公室场景。参与者需根据学生的学术成绩和人口统计数据，判断学生是“顺利毕业”还是“有辍学风险”。
AI 系统模拟：
- 采用Wizard-of-Oz（伪人）设置，而非真实模型，以严格控制准确率。
- 准确率设定： 人为设定为 73%，与人类参与者的预实验准确率（70%）相近，确保人机具有互补性知识（Complementary collaboration），即双方都有对错，需要协作。
- 错误控制： 15 个案例中，AI 在 4 个案例中故意给出错误预测。
因变量测量：
1. 自我报告信任： 修改版的人机信任（HCT）问卷。
2. 行为信任（依赖/Reliance）：
  - 一致率（Agreement Rate）： 最终决策与 AI 建议一致的比例。
  - 过度依赖（Overreliance）： 当 AI 错误时，用户仍采纳 AI 建议的比例。
  - 切换率（Switch Rate）： 仅在 2-step 组测量，即当 AI 建议与用户初选冲突时，用户改变主意的比例。

3. 关键贡献与结果 (Key Contributions & Results)

A. 自我报告信任与行为信任的关系

发现： 自我报告信任（问卷得分）与行为信任（一致率、切换率）之间仅存在弱相关（ $r \approx 0.25$ ）。
结论： 这两个构念（Constructs）是不同的。高问卷信任分数并不一定意味着用户会实际采纳 AI 建议，反之亦然。因此，在评估 AI 辅助系统时，必须分别测量这两种信任。

B. 决策工作流（2-step vs 1-step）的影响

对过度依赖（Overreliance）的影响：
- 反直觉结果： 研究未能证实2-step 设置能减少过度依赖。相反，数据表明 2-step 设置显著增加了过度依赖（ $\beta = 0.46, p = .001$ ）。
- 解释： 在 2-step 流程中，用户投入时间做出了初步判断，随后看到 AI 建议时，可能因为“承诺升级”或过度关注 AI 的权威性而更容易被错误建议带偏，即使 AI 是错的。
对自我报告信任的影响：
- 工作流本身没有直接的主效应，但与解释和领域知识存在显著的交叉交互效应（Crossover Interaction）。

C. 解释（Explanations）与工作流的交互效应

发现： 解释的效果取决于工作流设置。
- 在 2-step 设置中，提供解释提高了用户的自我报告信任。
- 在 1-step 设置中，提供解释反而略微降低了自我报告信任。
意义： 这表明关于“解释能否提升信任”的结论不能在不同工作流之间通用。之前的矛盾结果可能源于未考虑工作流这一调节变量。

D. 领域知识（Domain Knowledge）的作用

发现： 领域知识显著影响自我报告信任，但不影响行为依赖。
- 领域知识较低的用户在 1-step 设置中报告了更高的信任。
- 领域知识较高的用户在 2-step 设置中报告了更高的信任（可能是因为解释验证了他们的推理）。
结论： 用户特征（如专业知识）是设计 AI 辅助系统时必须考虑的关键变量。

4. 研究意义与启示 (Significance & Implications)

重新定义信任评估： 开发者不能仅依赖问卷来评估用户对 AI 的信任。必须结合行为指标（如一致率、切换率、过度依赖率）来全面评估系统表现。
谨慎使用 2-step 设计： 虽然 2-step 设计（认知强制）理论上旨在减少盲目依赖，但在本研究的特定任务中，它反而加剧了过度依赖。这意味着 2-step 流程可能更适合用于理解人机直觉的互补性（即分析用户何时改变主意），而不一定适合直接用于最终决策部署，除非配合其他机制防止过度依赖。
解释的语境依赖性： 解释并非总是有益的。其效果高度依赖于决策流程（1-step vs 2-step）和用户特征。设计者应避免“一刀切”的解释策略，需根据具体工作流调整。
人机协作设计建议：
- 如果目标是有效协作，应重点关注行为指标。
- 如果目标是系统可用性，需关注用户感知。
- 建议采用自适应工作流（Adaptive workflows），例如仅在用户低置信度时强制使用 2-step 流程，或允许用户选择是否查看解释。
未来方向： 需要更多基于真实场景（而非假设情境）和真实 AI 系统的研究，以验证这些发现是否具有普遍性。

总结

该论文通过严谨的对照实验揭示了人类-AI 决策中信任的复杂性。它打破了“解释总是好的”或"2-step 流程总是能减少过度依赖”的简单假设，强调了决策工作流、解释机制和用户特征三者之间复杂的交互作用。研究呼吁在 AI 辅助决策系统的设计与评估中，必须区分“感知信任”与“行为信任”，并根据具体场景定制化设计交互流程。