Do Metrics for Counterfactual Explanations Align with User Perception?

该研究通过实证分析发现,现有的反事实解释算法评估指标与人类对解释质量的感知之间相关性普遍较弱且高度依赖数据集,表明当前指标难以有效反映用户视角的解释质量,亟需采用更以人为本的评估方法。

Felix Liedeker, Basil Ell, Philipp Cimiano, Christoph Düsing

发布于 2026-03-17
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文探讨了一个非常有趣且重要的问题:我们在开发人工智能(AI)时,用来衡量“解释好坏”的数学公式,真的能代表普通用户心里的感受吗?

为了让你更容易理解,我们可以把这篇研究想象成一次"美食评分大调查"。

1. 背景:AI 的“菜谱”与“试吃员”

想象一下,AI 就像一个大厨,它做了一道菜(做出了一个预测,比如“这个人会得心脏病”)。

  • 反事实解释(Counterfactual Explanations):就是大厨给顾客的解释:“如果你少放点盐、多运动一下,这道菜(你的健康状态)就会变成‘健康’而不是‘生病’。”
  • 算法指标(Algorithmic Metrics):这是大厨自己用的“评分尺子”。比如尺子上写着:“盐放得越少越好(稀疏性)”、“离原来的菜谱越近越好(邻近性)”。大厨觉得,只要符合这些尺子,解释就是完美的。
  • 用户感知(User Perception):这是真正来吃饭的顾客(普通用户)。他们觉得解释好不好吃,可能跟盐放多少没关系,而是看“听起来像不像人话”、“有没有道理”、“能不能让我信服”。

论文的核心问题就是: 大厨手里的“数学尺子”,真的能量出顾客心里的“好吃程度”吗?

2. 实验过程:一场大规模的“试吃会”

研究团队(来自德国比勒费尔德大学)组织了一场大规模的试吃会:

  • 食材(数据集):他们选了三个不同的“菜单”:蘑菇(能不能吃)、肥胖程度(怎么吃会变胖)、心脏病(怎么预防)。
  • 试吃员(参与者):他们找了 167 个普通人,不是 AI 专家,就是普通的“路人甲”。
  • 任务:给 AI 生成的各种“反事实解释”打分。比如:“这个解释你听得懂吗?”“你觉得它合理吗?”“你满意吗?”
  • 对比:同时,他们计算了 7 种常见的“数学尺子”(算法指标)的分数。

3. 研究发现:尺子量不准人心

结果非常令人惊讶,甚至有点“打脸”:

  • 尺子与人心“各说各话”
    研究发现,那些数学尺子(算法指标)和用户心里的打分,几乎没有什么关系

    • 比喻:就像大厨拿着尺子量菜的温度,觉得 80 度是完美的;但顾客尝了一口觉得太烫了,根本没法吃。尺子上的数字再完美,也代表不了顾客嘴里的味道。
    • 甚至在不同的“菜单”(数据集)上,尺子和人心的关系还完全相反。在蘑菇菜单上,用户喜欢“改动少”的解释;但在肥胖菜单上,用户反而喜欢“改动多、信息全”的解释。这说明没有一把万能尺子
  • 把尺子凑在一起也没用
    有人可能会想:“那我把 7 把尺子凑在一起,综合打分总行了吧?”
    研究团队试了各种复杂的数学模型(就像把 7 种调料混在一起),结果发现:不仅没变好,反而更乱了。

    • 比喻:这就像你试图用“糖度”、“酸度”、“咸度”、“辣度”等 7 个数据来预测一道菜好不好吃。结果发现,把这些数据加在一起,还是预测不准。因为用户觉得“好吃”是一个整体的感觉,而不是几个数据的简单相加。

4. 结论:我们需要新的“味觉”

这篇论文的结论很明确:
目前我们用来评价 AI 解释好坏的那些数学公式,大部分是“自嗨”。它们并不能真实反映人类觉得解释得好不好。

  • 现状:我们太依赖计算机能算出来的东西(比如改动了几个字、距离有多远),却忽略了人是怎么思考的。
  • 未来:我们需要开发新的评价方法,这些方法不能只盯着数学公式,而要真正基于人类的直觉和感受。就像评价美食,不能只靠温度计,得靠试吃员的舌头。

总结

这就好比我们在造一辆自动驾驶汽车。
现在的工程师只关心“刹车距离是不是最短”、“转弯半径是不是最小”(算法指标)。
但这篇论文告诉我们:乘客(用户)可能根本不在乎这些数字,他们只在乎“这车开起来稳不稳”、“司机(AI)有没有礼貌”、“我坐得舒不舒服”。

如果工程师继续只用“刹车距离”来衡量汽车好不好,那他们永远造不出真正让人放心、让人喜欢的自动驾驶汽车。我们需要学会用“乘客的视角”来重新设计评价标准。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →